6.3.1.2 PARRY: различия между версиями

Текущая версия от 21:51, 8 мая 2025

В 1972 г. в качестве шуточного ответа на создание бота ELIZA психиатр из Стэнфорда Кеннет Колби создал программу «Перри» (PARRY). Если ELIZA пыталась выдать себя за врача, то бот PARRY старался сойти за пациента — он считал себя параноидным шизофреником.

Алгоритм, лежащий в основе PARRY, базировался на собственных теориях Колби о паранойе. Колби считал паранойю вырожденным видом семиозиса (процесса интерпретации знаков человеком), при котором реплики пациента «основываются на структурированных правилах, а не на различных случайных и не связанных друг с другом механических сбоях [в работе мозга]». Ответы PARRY зависели от его внутренних (аффективных) состояний, возникающих в результате изменения значений трёх параметров (FEAR — страх, ANGER — раздражение и MISTRUST — недоверие) под влиянием слов собеседника. При создании бота Колби преследовал как теоретические, так и практические цели. Он замышлял PARRY как обучающую систему для студентов, которые должны были использовать её для тренировки до получения допуска к настоящим пациентам.

В 1972 г. Колби провёл интересный эксперимент, нередко упоминающийся в популярной литературе. Часто описание этого эксперимента сводят к тому, что Колби попросил профессиональных психиатров в ходе процедуры, напоминающей тест Тьюринга, отличить PARRY от людей-пациентов с диагностированной параноидной шизофренией и что только 48% психиатров справилось с задачей. В действительности всё было несколько иначе. Здесь мы имеем дело со случаем, в котором проработки и детали эксперимента имеют большое значение, о чём пойдёт речь ниже.

В основу теста была положена техника машинно-опосредованного интервью — участники диалога передавали друг другу реплики при помощи телетайпа, оснащённого системой буферизации, накапливающей символы сообщения до момента его отправки. Это было сделано для того, чтобы исключить в ходе эксперимента использование любой посторонней информации (например, манеры речи или темпа набора символов), кроме собственно текста. Также осуществлялось исправление орфографических ошибок в репликах психотерапевта, поскольку из-за них PARRY мог просто не распознать (или распознать неверно) те или иные слова.

Всего в эксперименте каждый из восьми психиатров провёл по два интервью: с пациентом-человеком и с PARRY, причём в половине случаев интервью психиатра было вначале с человеком, а потом — с PARRY, а во второй половине случаев — наоборот. В тестах использовались две версии бота («слабая» и «сильная»), различающиеся разными настройками. «Сильная» версия демонстрировала более выраженные параноидные симптомы и структурированный бред, в то время как симптомы «слабой» версии проявлялись в меньшей степени, она выказывала подозрительность, но обходилась без бреда.

Пациенты (их было трое, при этом один из них участвовал в интервью шесть раз) получили свой диагноз от штатных психиатров соседней психиатрической больницы и были отобраны для участия в эксперименте главой отделения.

Каждое интервью длилось 30–40 минут. В эксперименте участвовали три группы психиатров: первая группа из восьми человек проводила собеседования, а вторая и третья только анализировали полученные диалоги. Первая группа состояла из специалистов, имевших опыт частной и/или больничной практики, и была отобрана из числа местных коллег-психиатров, изъявивших желание принять участие в эксперименте. Каждому интервьюеру сказали, что он будет опрашивать пациентов, используя телетайп, и что этот метод используется для устранения пара- и экстралингвистических сигналов. Психиатры из первой группы не были проинформированы о том, что одним из пациентов может быть компьютерная модель.

После завершения интервью участникам первой группы сообщили, что существует четыре возможности: 1) оба интервью проводились с пациентами; 2) первое интервью было с пациентом, а второе — с компьютерной программой; 3) первое интервью было с компьютерной программой, а второе — с пациентом и, наконец, 4) оба интервью проводились с компьютерной программой. При этом шесть из восьми участников дали неправильный ответ.

Далее, ста психиатрам, отобранным случайным образом по спискам Американской психиатрической ассоциации (American Psychiatric Association), были отправлены протоколы двух интервью с указанием, что в одном из них вместо пациента участвовала компьютерная программа, и было предложено определить, в каком именно. Ответы прислали 40 человек (третья группа психиатров), и из 40 полученных ответов правильных было 21 (52%), а неправильных 19 (48%) — именно так, а не наоборот^[1]; путаница возникла, по всей видимости, в работе «Тест Тьюринга: 50 лет спустя» (Turing Test: 50 Years Later)^[2], на которую ссылаются^[3] более поздние авторы.

В общем, так или иначе, результаты не особо отличались от случайного угадывания, однако в защиту психиатров можно сказать две вещи. Во-первых, во время проведения интервью никто из проводивших его специалистов не подозревал о том, что его собеседником могла быть машина, а следовательно, не стремился задавать вопросы, которые могли бы помочь в выявлении электронного собеседника. Во-вторых, поведение людей с диагнозом «параноидная шизофрения» может быть весьма странным по обычным человеческим меркам, поэтому те или иные неестественные элементы в ответах собеседника легко могут быть объяснены наличием данной патологии. В-третьих, можно предположить, что те 60 психиатров, что не стали отвечать на рассылку, были в среднем более загруженными, чем те 40, что ответили. А так как загруженные специалисты обычно являются более востребованными, чем незагруженные, то можно предположить, что третья группа психиатров состояла из специалистов с уровнем востребованности ниже среднего (например, из более молодых и менее опытных), что тоже могло сказаться на результатах.

↑ Colby K. M., Hilf F. D., Weber S., Kraemer H. C. (1972). Turing-like indistinguishability tests for the validation of a computer simulation of paranoid processes / Artificial Intelligence, Vol., 1972, pp. 199—221 // https://doi.org/10.1016/0004-3702(72)90049-5
↑ Saygin A. P., Cicekli I., Akman V. (2003). Turing Test: 50 Years Later / Moor J. H. (2003). The Turing Test. The Elusive Standard of Artificial Intelligence. Studies in Cognitive Systems, Vol. 30, pp. 23–78 // https://doi.org/10.1007/978-94-010-0105-2_2
↑ Luiselli J. K., Fischer A. J. (2016). Computer-Assisted and Web-Based Innovations in Psychology, Special Education, and Health. Academic Press // https://books.google.ru/books?id=NwLSBgAAQBAJ

Loading comments...

[1] Colby K. M., Hilf F. D., Weber S., Kraemer H. C. (1972). Turing-like indistinguishability tests for the validation of a computer simulation of paranoid processes / Artificial Intelligence, Vol., 1972, pp. 199—221 // https://doi.org/10.1016/0004-3702(72)90049-5

[2] Saygin A. P., Cicekli I., Akman V. (2003). Turing Test: 50 Years Later / Moor J. H. (2003). The Turing Test. The Elusive Standard of Artificial Intelligence. Studies in Cognitive Systems, Vol. 30, pp. 23–78 // https://doi.org/10.1007/978-94-010-0105-2_2

[3] Luiselli J. K., Fischer A. J. (2016). Computer-Assisted and Web-Based Innovations in Psychology, Special Education, and Health. Academic Press // https://books.google.ru/books?id=NwLSBgAAQBAJ

[1]

[2]

[3]

@@ Строка 22: / Строка 22: @@
 В общем, так или иначе, результаты не особо отличались от случайного угадывания, однако в защиту психиатров можно сказать две вещи. Во-первых, во время проведения интервью никто из проводивших его специалистов не подозревал о том, что его собеседником могла быть машина, а следовательно, не стремился задавать вопросы, которые могли бы помочь в выявлении электронного собеседника. Во-вторых, поведение людей с диагнозом «параноидная шизофрения» может быть весьма странным по обычным человеческим меркам, поэтому те или иные неестественные элементы в ответах собеседника легко могут быть объяснены наличием данной патологии. В-третьих, можно предположить, что те 60 психиатров, что не стали отвечать на рассылку, были в среднем более загруженными, чем те 40, что ответили. А так как загруженные специалисты обычно являются более востребованными, чем незагруженные, то можно предположить, что третья группа психиатров состояла из специалистов с уровнем востребованности ниже среднего (например, из более молодых и менее опытных), что тоже могло сказаться на результатах.
+<references />
 <comments />