2009-10-30 5 views
0

Я прошу об этом академически, я хочу задать вслух очень важный вопрос и попросить сообщество попытаться ответить на него. Можем ли мы создать систему, которая генерирует сцену для воспроизведения по живому анонимному видеочату, который может читать текст, набранный на нем, и отвечать чатботом?Целесообразность избиения теста Тьюринга с помощью современного программного обеспечения?

Видео в реальном времени в Интернете часто размыто и имеет низкое разрешение. Невозможно разглядеть много деталей на сцене отдаленной стороны. Сцены могут отображаться с помощью современных программных инструментов, которые выглядят очень реально, когда они не перемещаются. Сделать их реалистично - большая часть программного обеспечения для моделирования.

Лица могут отображаться со скоростью 24 кадра в секунду кластером из 24 систем, способных работать 1 кадр в секунду. После этого видео будет иметь 1-секундное отставание от точки, в которой было принято решение о том, какое выражение лица вырабатывать. Эти выражения лица и их поколение являются ключевой проблемой. Требование реализма кожи - это проблема, решаемая графическим сообществом.

Условные обозначения лиц были классифицированы несколькими исследователями. Они также могут быть представлены, это было показано в современной компьютерной графической литературе. Мы можем сделать это, если мы сможем узнать, какие из них подходят для данной ситуации.

Chatbots используются в течение многих десятилетий. В настоящее время существуют довольно «умные» чат-программы, которые будут читать то, что задают и отвечают разумным способом. Они всегда делали это с помощью текста, но программное обеспечение для чтения текстовых сообщений может говорить в человеческом голосе, а программное обеспечение для распознавания речи становится все лучше с каждым годом.

Что я предлагаю, так это то, что он должен быть довольно рудиментарным, чтобы соединить все эти разрозненные части разработки программного обеспечения и создать поистине удивительный тест-тест.

Эта программа может войти в виртуальное пространство и отобразить реалистичную среду, как на веб-камере, как и на других участниках. Он может наблюдать за их выражениями лица, и он может слушать их речь, и он может читать их текст. Затем он мог бы создать ответ и либо напечатать, либо передать его в группу. Выбор того, с чем нужно реагировать, представляет собой сложную проблему, которую даже большинство людей не освоили. Мы можем сблизиться с большой работой.

Тест Тьюринга доказывает, что коммуникатор является человеком, но «доказательством» только в том смысле, что он достаточно хорош, чтобы обманывать судей. Если судьи-люди просто все, они вряд ли будут применять строгую формальную процедуру. Догадка или падение для трюка достаточно хороши.

Как вы думаете, мы можем это сделать?

Является ли этот план испорченным? Есть ли моральные последствия для обмана среднего зрителя таким образом? Можем ли мы зарабатывать миллионы долларов, создавая личных умных помощников?

+0

Хотя это интересно думать, и, вероятно, будет делать большой пост в блоге, это не уместно. Кроме того, вы слишком оптимистично оцениваете, насколько хорошо может работать бот-чат. Тест Тьюринга можно сделать по телеграфу, ваша идея не связана с истинным вопросом. –

ответ

2

В этой области уже проводятся исследования. Цифровые аватары были использованы с некоторым успехом. Некоторые из ключевых моментов:

  • Современные ПК могут отображать убедительное человеческое лицо в реальном времени, без проблем. Просто введите среднюю карту gfx и хорошую модель, и все готово. (см., например, Dawn).

  • В настоящее время программное обеспечение для создания голосовой почты может свободно передавать текст, и оно может произносить его должным образом. Это все еще немного однообразно, поскольку у говорящего нет эмоций. (См. this article).

  • Существует исследование, чтобы заставить машины «чувствовать». Я говорю «чувствую», потому что это просто небольшая программа с несколькими переменными («гнев», «страх», «голод», «скука», «грусть», ...) и сложный набор правил, которые влияют эти переменные. (См. Wikipedia article for details).

Основная проблема прямо сейчас в том, что мы не знаем, какие эмоции есть. Являются ли они просто количеством молекул, плавающих в определенных частях мозга? Если да, то какие молекулы и в какой части мозга? Нейробиологи сегодня пытаются предсказать состояние ума, глядя на МРТ-изображения. Чтобы понять, что это значит, вот аналогия: они пытаются угадать, что такое человечество, глядя на распределение света на Земле от Луны своими невооруженными глазами.

Так что мы не понимаем, что такое эмоции. Следующим препятствием является то, что эмоции ничего не означают без контекста. Легко написать программу, которая чувствует себя «грустной», просто установив значение переменной sadness в 1.0. Но это было бы странно, если бы не было причин. Таким образом, программа должна быть в состоянии следить за разговором, строить мысленный образ (что говорят люди о и, как они себя чувствуют сейчас), а затем настроить свое собственное психическое состояние в соответствии с действующими правилами соответствующей группы.

Вы знаете, как это чувствуется, когда вы впервые вступаете в новую группу и пытаетесь понять, что происходит и как вы себя ведете. Это трудная задача для людей и, тем более, для программы.

Существует статья "Können wir eine Seele simulieren?" (Geman только но output of Google translate довольно хорошо.)

2

Мы не можем пройти традиционный текстовый тест Тьюринга. Добавление видео сверху не имеет значения.

+0

Ну, мы не проходили его в академическом смысле, но Элиза смогла обмануть многих людей, и когда вы смотрите на текст в чатах, это не так сложно подделать. "RUgrl?" «L8R» «CU» «BRB» «LOL» ...;) –

+0

Спасибо, Аарон, я просто говорю о том, чтобы обманывать людей, чтобы это могло быть товарным продуктом для торговых автоматов или справочных служб или регистраторов или банковских счетчиков. Не пытаясь на самом деле доказать тест на уловку, я только поднял его, чтобы все указали в правильном направлении. – Karl

1

Большая проблема заключается не в том, чтобы визуализировать внешний вид (визуальный или вокальный), а в том, чтобы визуализировать интеллект и эмоции.

Что вы предлагаете, является интерфейсом в реальном времени Shrek. Но как насчет фонового?

+0

Задняя часть жесткая и бесконечно глубокая, поэтому я не беспокоюсь о ее попытке ее решить. Мы не можем программировать душу, но если бы мы могли просто обмануть людей или заставить их естественным образом взаимодействовать с их ПК ... это может быть очень весело. – Karl

+0

Вы не можете обмануть людей, не подражая душе. Если вы обнаружите, что людей обманывают, я бы не стал пари, что они обыграли тест Тьюринга ... – mouviciel

2

Я не согласен с присутствием вашего вопроса здесь, но я считаю необходимым указать, что вы серьезно неправильно поняли, что точка теста Тьюринга. Это не имеет никакого отношения к тому, чтобы выглядеть как человек или звучать как один.

Фактически, в большинстве предлагаемых испытаний используется терминал телетайпа с задержкой по времени, поэтому имеется как можно меньше информации о передаче за пределы фактического сообщения, которое находится под тестом.

Ненавижу, чтобы разорвать ваш пузырь, но текущее поколение чатов и даже самые продвинутые ИИ в лаборатории нигде не сравнится с тестом на испытания. Очень быстро становится очевидным, что там нет настоящего человека.

+1

Я бы сказал, что, по крайней мере, для чатов, это потому, что они спам нам каждые 15 минут, и мы быстро узнаем их программирование и/или они в любом случае, мало имеют способа программирования за пределами запланированных сообщений. –

+0

Чатбот не может поддерживать постоянный разговор. Попытайтесь спросить его о том, где он родился, что это за мать, какой цвет волос у нее был. Когда вы переходите к разговору о реальном мире, согласованность разваливается, даже для эвристических систем смысла на естественном языке. –

+0

Я не хотел на самом деле избивать тщательно проведенное исследование, только социальное событие. – Karl

 Смежные вопросы

  • Нет связанных вопросов^_^