Что это? Тест Тьюринга, придуманный в 1950 году, был составлен с целью узнать, могут ли машины думать как люди. В ходе теста ведущий участник должен определить, кто из двоих его собеседников не является человеком.
Насколько актуален сейчас? Тест Тьюринга с годами стал важной частью исследований и разработок в сфере искусственного интеллекта. И хотя сам он устарел, но стал основой для возникновения других программ, созданных для упрощения жизни людей.
В статье рассказывается:
- История возникновения теста Тьюринга
- Суть теста Тьюринга
- Преимущества и недостатки теста Тьюринга
- Премия Лебнера за прохождение теста Тьюринга
- Альтернативы тесту Тьюринга
- Виртуальные помощники как прогресс искусственного интеллекта
-
Пройди тест и узнай, какая сфера тебе подходит:
айти, дизайн или маркетинг.Бесплатно от Geekbrains
История возникновения теста Тьюринга
Что такое тест Тьюринга и зачем он нужен? Этот тест, разработанный английским ученым, должен был определить, может ли вычислительная машина (компьютер) обладать человеческим мышлением.
В чем заключается тест Тьюринга? Спустя семьдесят с лишним лет сложно понять, по каким параметрам автор предполагал выявлять разум компьютера. В целом, суть в следующем. Если человек, общаясь с искусственным интеллектом, сможет понять, что это вычислительная машина, она не прошла тест Тьюринга. Если же собеседник не догадается, что ведет диалог с ИИ, значит, искусственный разум справился с задачей.
Чем известен автор теста, названного в его честь? Алан Мэтисон Тьюринг (1912-1954 гг) специализировался на криптографии, информатике и математической логике. Кроме теста, одним из самых громких его изобретений считается проект машины Тьюринга (1936 год), на основе которой впоследствии разрабатывали современный компьютер. Также Алан Тьюринг смог найти шифр к сообщениям криптографической машины «Энигма», с помощью которой немцы во время войны передавали секретные данные.
Суть теста Тьюринга
Как Алану Тьюрингу пришла в голову идея теста? Ему помогла игра, популярная в те времена. Суть ее заключалась в том, чтобы человек догадался, с кем переписывается. Минимальное количество участников — трое. Они не видят друга, находясь в разных комнатах. Двое из игроков должны быть обязательно разнополые (назовем их условно A и B), пол третьего (C) значения не имеет, он обменивается записками с первыми двумя игроками.
Смысл этой игры для вечеринок был в том, что C (эту роль также называют «судья») может только переписываться с A и B, стараясь при этом догадаться, кто из них мужчина, а кто женщина. Игрок A всеми силами старается обмануть судью, а B, напротив, должен давать подсказки и направлять догадки судьи в верное направление.
В тесте Тьюринга один из участников заменяется компьютером. В первом варианте программа выступает в роли игрока А, цель которого – ввести судью в заблуждение, то есть выдать себя за реального человека, изобразив это лучше, чем человек B. В случае успеха A (компьютера) можно констатировать, что он обладает мышлением, то есть программа проходила тест Тьюринга.
Была также вторая конфигурация игры. В ней и компьютер, и второй игрок пытаются выдать себя за того, кем не являются, и обмануть C. Цель – выявить, кому удастся ввести в заблуждение судью — другому человеку или вычислительной машине (искусственному интеллекту).
Базируясь на второй версии игры, Тьюринг так отвечал на вопрос, в чем состоит суть теста. Он хотел проверить, способен ли компьютер с большим объемом памяти, а также высокой скоростью проведения операций и соответствующей программой заменить одного из игроков (A, женщину), тогда как вторым игроком (B) и судьей (C) будут люди.
входят в ТОП-30 с доходом
от 210 000 ₽/мес
Скачивайте и используйте уже сегодня:
Топ-30 самых востребованных и высокооплачиваемых профессий 2023
Поможет разобраться в актуальной ситуации на рынке труда
Подборка 50+ бесплатных нейросетей для упрощения работы и увеличения заработка
Только проверенные нейросети с доступом из России и свободным использованием
ТОП-100 площадок для поиска работы от GeekBrains
Список проверенных ресурсов реальных вакансий с доходом от 210 000 ₽
Важно, что в первом варианте тест считается пройденным машиной, если программа смогла ввести проверяющего в заблуждение. Во втором же варианте акцент делается на том, способен ли компьютер выдать себя за человека. Часто это различие остается вне фокуса внимания, и если человек был обманут программой, то ее рассматривают как ИИ, успешно прошедший тест Тьюринга.
Преимущества и недостатки теста Тьюринга
Преимущества теста Тьюринга:
- Сужает критерии, по которым мы определяем наличие интеллекта. Рассматривает его как способность давать адекватные ответы на конкретные вопросы. То есть облегчает дискуссию об ИИ, задавая систему координат.
- Избавляет от бесконечных размышлений на тему «Обладает ли компьютер собственными мыслительными процессами?», «Должен ли компьютер понимать, что делает?».
- Направляет исследовательскую деятельность «судьи» на обработку и осмысление ответов, убирает предвзятое отношение к человеку, присутствующему в качестве второго участника.
Есть в данной проверке ИИ и слабые места. Например, получается, что тест Тьюринга определяет наличие искусственного разума по способности провести, запутать живого человека. Возникает философский вопрос: «Неужели существо считается разумным, если в силах манипулятивно воздействовать и обманывать?». При разработке теста считалось, что с задачей справится программа, которой удастся не обмануть, а «вести себя» как человек.
Но на деле оказалось, что пройти тест Тьюринга чаще удается роботам, которых научили хитрить. В частности, они допускали в переписке орфографические ошибки, отвечали неразвернуто или признавались в том, что не знают ответ на вопрос. Такие уловки помогали ввести людей в заблуждение, так как по четким ответам на все вопросы можно было бы легко распознать искусственный интеллект.
Читайте также!
В итоге, тест Тьюринга выявляет не наличие у программы функций человеческого мышления, а ее умение имитировать письменную или устную речь человека и поддерживать диалог. Поэтому нельзя утверждать, что сегодня тест Тьюринга проверяет способности ИИ в полной мере. Ведь современным компьютерам не составляет никакого труда совершать неподвластные большинству людей операции в самых разных областях знаний. Умение обмениваться сообщениями, имитируя человеческое общение, уже не рассматривается как признак высокого уровня ИИ.
Базируясь на критерии Алана Тьюринга, мы слишком занижаем требования к программным продуктам с искусственным интеллектом, считают некоторые специалисты. Такие ориентиры мешают формулировать более высокие стандарты и требования для ИИ. Напротив, человек учит искусственный разум своим не самым лучшим чертам (ложь, хитрость, манипуляции), не позволяя ему развиваться.
Стоит отметить, что во времена разработки теста Тьюринга (1950 год) его создатель имел дело с вычислительными машинами, способности и мощности которых были многократно ниже, чем у современных. Тем не менее тест, разработанный Аланом Тьюрингом, по-прежнему играет важную роль в проверке и аттестации программных продуктов с искусственным интеллектом.
Премия Лебнера за прохождение теста Тьюринга
Спустя 40 лет после разработки теста Тьюринга профессиональное сообщество предложило награждать премией Лебнера программистов, которым удалось создать продукт, обладающий свойствами, максимально отвечающими параметрам разумности. Победитель получал денежное вознаграждение. После 2020 года премия не назначается.
Скачать файлПо задумке создателей, автор программы, которая справилась бы с тестом Тьюринга в текстовом формате, был бы награжден серебряной медалью и призом в размере 25000 долларов. Тому, чья разработка справилась бы с задачей Тьюринга, используя текст, изображения и звуки, полагалась золотая медаль и 100000 долларов, на чем премия логично и завершила бы свое существование.
на обучение «Искусственный интеллект с нуля» до 24 ноября
Вот имена разработчиков, чьи творения максимально приблизились к выполнению задачи, поставленной Аланом Тьюрингом:
Год | Автор | Программа |
1991 | Джозеф Вайнтрауб | PC Therapist |
1992 | Джозеф Вайнтрауб | PC Therapist |
1993 | Джозеф Вайнтрауб | PC Therapist |
1994 | Томас Уолен | TIPS |
1995 | Джозеф Вайнтрауб | PC Therapist |
1996 | Джейсон Хатченс | HeX |
1997 | Девид Леви | Converse |
1998 | Робби Гарнер | Albert One |
1999 | Робби Гарнер | Albert One |
2000 | Ричард Воллес | A.L.I.C.E. |
2001 | Ричард Воллес | A.L.I.C.E. |
2002 | Кевин Коппл | Ella |
2003 | Юрген Пирнер | Jabberwock |
2004 | Ричард Воллес | A.L.I.C.E. |
2005 | Ролло Карпентер | George |
2006 | Ролло Карпентер | Joan |
2007 | Робер Медексза | Ultra Hal |
2008 | Фред Робертс | Elbot |
2009 | Дейвид Леви | Do-Much-More |
Альтернативы тесту Тьюринга
По прогнозам Алана Тьюринга, в 2020 году вероятность отличить в подобном тесте искусственный интеллект от живого человека должна была составлять менее 70 %.
Тем не менее, предположения британского математика и информатика не оправдались. Рохит Прасад, занимающийся научным направлением в Amazon, полагает, что не стоит брать за основу в разработке ИИ критерии Тьюринга. По его мнению, лучше не учить искусственный разум подражанию человека, а стремиться создать более совершенную версию человеческого мышления, которая сможет качественно улучшить бытовую жизнь людей, в том числе, с ограниченными возможностями.
Для этого необходимо, чтобы робот обладал высокой скоростью реакции, воспроизводимой памятью и такими человеческими «чертами», как рассудительность, самообладание, владение речью. Так он сможет помогать людям в ежедневных рутинных делах.
В настоящее время программисты, создающие искусственный разум, делают акцент на следующих направлениях:
- умение вести диалог;
- увеличение объема информации;
- высокая степень обучаемости;
- распознавание информации сенсорами;
- способность принимать решения;
- полная объективность.
Например, различные программы с искусственным интеллектом учатся решать задачи, с которыми они впервые встречаются в Abstraction and Reasoning Challenge, организованном Kaggle.
Читайте также!
Студенты-участники Alexa Prize Socialbot Grand Challenge, направленного на разработку разговорных технологий ИИ, должны в рамках состязания создать чат-ботов, способных вести непринужденный естественный диалог не меньше 20 минут. ИИ должен поддерживать самые разные темы: от политики до отдыха. Независимые судьи в рамках конкурса ставят оценки ботам. А перед этим пользователи в баллах измеряют свое желание продолжить такое общение. Программист с оценкой 4.0 переходит к заданию Grand Challenge, но такого прецедента еще не случалось.
Создание ИИ с навыками поддержания беседы основано на фундаментальном обучении, на котором базируются нейронные методы. Благодаря этим технологиям голосовые помощники имитируют чувство юмора и сочувствие, но не выдают себя за людей.
Виртуальные помощники как прогресс искусственного интеллекта
Очередным этапом в развитии ИИ стало повсеместное применение голосовых помощников в быту.
Большинство программ с искусственным разумом управляются голосовыми командами. Задания, которые они способны выполнить, могут быть как совсем простыми (установить время пробуждения на устройстве), так и более комплексными, например, придумать программу на выходные. Ориентиром для современных ИИ являются системы в концепции Ambient AI. Речь о том, чтобы голосовые помощники не просто решали простые задачи по запросу, но и давали советы или подсказки. В частности, виртуальная помощница Alexa сообщит, если зафиксирует звук бьющегося стекла, а также при установке будильника на утро напомнит потушить свет в доме.
Спустя несколько десятилетий концепция теста Тьюринга потеряла актуальность. Ее создатель не мог знать, какой скачок сделает прогресс. Сегодня мы не рассматриваем прохождение системой теста как показатель ее эффективности и практичности. Перед ИИ теперь ставят более сложные задачи, чем имитировать общение или выдать себя за живого человека — служить людям и делать их жизнь счастливее.