|
||||
|
Глава 7 ГОВОРЯЩИЕ ГОЛОВЫ[94] Как мы понимаем язык и используем его в речи На протяжении столетий людей ужасала возможность того, что созданные ими вычислительные машины могут перехитрить их, в чем-то превзойти или лишить рабочих мест. Этот страх часто обыгрывался в литературе, начиная со средневековой еврейской легенды о Големе, глиняном истукане, ожившем, когда ему в рот вложили надпись с именем Бога, до HAL — взбунтовавшегося компьютера из «Космической одиссеи 2001». Но когда в 1950-х гг. возникла такая отрасль прикладной науки, как «искусственный интеллект» («Artificial intelligence» — AI), создалось впечатление, что научная фантастика грозит обернуться пугающей реальностью. Когда компьютер высчитывает число «пи» до миллионного знака после запятой или начисляет зарплату сотрудникам фирмы, то нетрудно признать его право на существование, но вдруг обнаружилось, что компьютеры еще и доказывают логические теоремы и играют в шахматы на высоком уровне. В последующие годы появились компьютеры, которые могли обыграть любого, за исключением гроссмейстера, и программы, превосходившие многих экспертов, когда речь шла о рекомендациях — какие подобрать лекарства при бактериальных инфекциях или куда инвестировать пенсионные фонды. А раз компьютеры решали такие требующие умственного напряжения задачи, казалось, дело лишь во времени — и СЗРО[95] или Терминатора можно будет заказать по каталогу. Единственное, что оставалось, это запрограммировать компьютеры на выполнение простых заданий. Согласно легенде, в 1970-х гг. Марвин Минский, один из создателей AI, дал своему аспиранту такое задание на лето — написать «зрительную программу». Но домашние роботы все еще оставались в области фантастики. Главный урок, извлеченный разработчиками AI после тридцати пяти лет работы состоял в том, что сложные проблемы просты, а простые сложны. То, что доступно разуму четырехлетнего ребенка и для нас является само собой разумеющимся — узнать знакомое лицо, поднять карандаш, пересечь комнату, ответить на вопрос — в действительности является решением одних из самых сложных технологических проблем. Пусть вас не вводят в заблуждение роботы на конвейере в рекламных роликах автомобилей: все, чем они занимаются — это сварка и распыление краски — а такие задачи не требуют обязательного присутствия неуклюжего мистера Магу[96], который бы за чем-то наблюдал, что-то держал или что-то куда-то клал. Если вы хотите поставить в тупик систему искусственного интеллекта, задайте ей следующие вопросы: «Что больше — Чикаго или хлебница?», «Носят ли зебры нижнее белье?», «Может ли пол подняться и покусать вас?», «Если Сьюзен идет в магазин, идет ли ее голова вместе с ней?». Большинство страхов перед автоматическими системами основано не на том, что действительно должно вызывать опасения. Это аналитикам финансового рынка, инженерам нефтехимической отрасли и членам судейской коллегии стоит опасаться, что с появлением нового поколения разумных машин они потеряют работу и будут вытеснены последними. Садовники, портье и повара могут в ближайшие десятилетия быть уверены, что останутся на своих местах. Понимание предложения — это одна из вышеупомянутых тяжелых легких проблем. Чтобы общаться с компьютерами нам все еще приходится учить их языки, сами они недостаточно умны, чтобы выучить наши. Вообще, это слишком легко — думать, что компьютеры понимают больше, чем они на самом деле способны понять. Недавно был учрежден ежегодный конкурс, какая компьютерная программа лучше всего введет в заблуждение пользователя, заставив думать, что он общается с человеком. Целью этого конкурса на премию Лобнера (Loebner Prize) было воплотить предположение, сделанное Аланом Тьюрингом в знаменитой работе 1950 г. Он предложил использовать для ответа на философский вопрос «Может ли машина мыслить?» имитационную игру, где арбитр разговаривает с человеком через один терминал и с компьютером, запрограммированным на имитацию человека — через другой. Если арбитр не может отличить, кто где, то, по мысли Тьюринга, нет оснований отрицать, что компьютер может думать. Если отбросить философию, то для конкурсной комиссии было очевидно, что ни одна программа не сможет и близко подойти к выигрыванию премии в 100 000 долларов, поэтому ее размер был уменьшен до 1 500 долларов, что было честнее по отношению к машине. Каждый из арбитров должен был придерживаться одной темы беседы, выбранной программистом или конкурирующим с компьютером человеком, кем бы он ни был, и арбитру не позволялось использовать никаких «хитростей или уловок», например, повторять вопрос десять раз или спрашивать, носят ли зебры нижнее белье; беседа должна была быть «естественной». После примерно семи минут общения с каждой из нескольких программ и их соперников-людей, арбитры указали на то, что все люди более «человекоподобны», чем любой из компьютеров. Тем не менее, около половины арбитров спутали выигравшую программу с человеком. Это достижение является менее впечатляющим, чем кажется. Правила связали арбитрам руки: «неестественные хитрости и уловки» — это иное название любой попытки установить, разговариваешь ты с человеком или с машиной, что и является смыслом конкурса! Кроме того, программист-победитель тонко использовал возможность выбирать тему беседы для своей программы. Он выбрал «эксцентричную беседу», которая является сомнительным примером «темы» и сама по себе может быть полна непоследовательностей:
По сути программист просто усовершенствовал технологию, изобретенную в 1965 г. ученым-компьютерщиком Джозефом Вейценбаумом. Вейценбаум написал туповатую программу, названную ELIZA в честь героини Бернарда Шоу; эта программа искала несколько ключевых слов во вводимой строке, извлекала фиксированный ответ из списка и вставляла фрагменты вводимой строки в ответ (с некоторыми небольшими изменениями, например «ты» вместо «я»). Таким образом в примитивной форме имитировалась беседа. Один вариант программы под названием Doctor копировал поведение психотерапевта — приверженца философии Карла Роджерса, считавшего, что терапевт должен повторять пациенту его же собственные утверждения для их осмысливания. Эта версия программы позже продавалась как компьютерная игра в магазинах «Рейдио Шэк»[98], а другая версия поступает в комплекте с моим текстовым редактором GNU Emacs. (В документации сказано: «Если при использовании Emacs что-то не получается, и ни один из указанных выше приемов не решает проблему, Emacs все же может вам помочь. Наберите: „M-x doctor RET“».) Вот типичный диалог:
К ужасу Вейценбаума, однажды он увидел, как его секретарша припала к терминалу и изливает душу программе. У большинства ученых-компьютерщиков конкурс на премию Лобнера вызывает раздражение. Они считают его не имеющим научной ценности рекламным трюком, задача которого — обвести вокруг пальца непрофессионала, а не научить компьютер речи. (Разработчикам искусственного интеллекта и другим профессионалам, разбирающимся в проблемах языка, не разрешили быть арбитрами, но ни один из них и не рвался участвовать в конкурсе, заявки поступали от любителей.) Этот конкурс примерно так же продуктивен, как будет продуктивна реклама биологических исследований, если на премию выдвинуть создателя искусственного цветка из шелка, самого похожего на естественный; или как будет продуктивна работа над космической программой, где высадка на Луну осуществится на съемочной площадке Голливуда. Была проведена интенсивная работа по созданию компьютерных систем, понимающих язык, но ни у одного серьезного инженера не хватит дерзости утверждать, что система, дублирующая языковые способности человека, появится в недалеком будущем. В действительности, с точки зрения ученого, люди не имеют права так хорошо понимать предложения, как они это делают. Они не просто решают до абсурда сложную задачу, но еще и делают это быстро. Понимание, как правило, происходит в режиме «реального времени». Слушающий действует синхронно с говорящим, а не ждет конца отрезка речи, чтобы истолковать его через соразмерный промежуток времени, подобно критику, пишущему рецензию на книгу. А временной промежуток между тем, что произнес говорящий, и тем, что воспринял слушающий, чрезвычайно короток: один или два слога за половину секунды. Некоторые люди могут понимать и повторять предложения, следуя за речью говорящего с отставанием на четверть секунды! Понимание процесса понимания имеет и иное практическое применение, помимо создания машин-собеседников. Понимание предложений людьми происходит быстро и эффективно, но не идеально. Оно работает, когда воспринимаемый поток речи или текст определенным образом структурирован. В противном случае процесс может забуксовать, пойти в обратном направлении, и возникнет неправильное понимание. Исследуя понимание языка в этой главе, мы выясним, какие виды предложений могут путаться в сознании человека, воспринимающего речь. Один из практических источников информации — это набор рекомендаций для написания ясной прозы, научное руководство по стилистике, например то, что написано Джозефом Уильямсом в 1990 г., — «Стиль: как добиться ясности и изящества», в нем содержатся многие лингвистические находки, которые мы будем рассматривать. Другое практическое применение связано с областью права. Судьи часто сталкиваются с тем, что им приходится гадать, как среднестатистический человек воспримет двусмысленный отрывок текста, например, при изучении клиентом контракта, заслушивании инструкций присяжными и чтении представителем общественности потенциально клеветнической характеристики. Многие из человеческих привычек толкования текста были определены благодаря лабораторным исследованиям, а лингвист и юрист Лоренс Солэн объяснил связь между языком и правом в своей интересной книге 1993 г. «Язык судей», к которой мы еще обратимся. * * *Как происходит понимание предложения? Первый этап — это синтаксический разбор. Он не имеет отношения к тем упражнениям, которые вы, стиснув зубы, делали в начальной школе, и о которых у Дейва Барри, ведущего газетной рубрики «Спроси у Господина Языка», осталось такое воспоминание:
Но понимание действительно включает сходный с этим процесс нахождения подлежащего, сказуемого, дополнения и т.д., который происходит бессознательно. Если только вы не Вуди Аллен, в ускоренном темпе читающий «Войну и Мир», вам нужно сгруппировать слова в синтаксические группы, определить, что является группой подлежащего при каком сказуемом, и так далее. Например, чтобы понять предложение The cat in the hat came back ‘Кошка в шляпе вернулась’ нужно объединить в одну группу слова the cat in the hat ‘кошка в шляпе’, чтобы понять, что это кошка вернулась, а не шляпа. Чтобы отличить предложение Dog bites man ‘Собака кусает человека’ от Man bites dog ‘Человек кусает собаку’ нужно найти подлежащее и объект. А чтобы различить предложения Man bites dog ‘Человек кусает собаку’, Man is bitten by dog ‘Человек искусан собакой’ и Man suffers dog bite ‘Человек перенес укус собаки’, нужно обратиться к словарным статьям упомянутых глаголов в ментальном словаре, чтобы определить, что происходит с подлежащим человек. Сама грамматика является просто кодом или протоколом, статичной базой данных, определяющей, какие виды звуков соответствуют каким видам значения в определенном языке. Это не рецепт и не программа для говорения и понимания. Говорение и понимание основаны на одной и той же базе данных (язык, на котором мы говорим, это тот же язык, который мы понимаем), но им также необходимы процедуры, которые бы четко, шаг за шагом, обозначили, что необходимо делать сознанию, когда становятся слышимыми слова, или когда сам собираешься начать говорить. Ментальная программа, анализирующая структуру предложения во время восприятия речи, называется «синтаксическим анализатором» («parser»). Наилучший способ понять, как работает процесс понимания, это проследить за синтаксическим разбором простого предложения, порожденного какой-нибудь простенькой грамматикой, например той, что упоминалась в главе 4, и которую я повторяю здесь:
Возьмем предложение The dog likes ice-cream ‘Эта собака любит мороженое’. Первое слово, с которым сталкивается ментальный синтаксический анализатор — это the. Синтаксический анализатор наводит о нем справки в ментальном словаре; это то же самое, что обнаружить данное слово в правой части правила и выяснить его категорию, указанную в левой части. Это детерминатор (determiner, det). Следовательно синтаксический анализатор может вырастить первую веточку предложения на дереве. (Правда, дерево, растущее сверху вниз от листьев к корням невозможно в ботанике.) Детерминаторы, как и все слова, должны быть частью какой-либо большей синтаксической группы. Синтаксический анализатор может вычислить, какая именно синтаксическая группа имеется в виду, проверив, в правой части какого правила имеется «det». Это будет правило, определяющее именную группу, NP. Дерево может быть продолжено: Эта обособленная структура должна быть удержана в некой определенной памяти. Синтаксический анализатор запоминает, что находящееся в нашем распоряжении слово the является частью именной группы, которая скоро должна быть укомплектована словами, которые заполнили бы остальные слоты, в данном случае — по меньшей мере одним существительным. Тем временем дерево продолжает расти, поскольку именные группы не могут оставаться ни к чему не присоединенными. Проверив, правая сторона каких правил содержит символ NP, синтаксический анализатор имеет несколько вариантов на выбор. Только что построенная именная группа может быть частью предложения, частью глагольной группы или частью предложной группы. Эту задачу выбора можно решить, исходя из главного: все синтаксические группы должны быть в итоге включены в предложение (S), а предложение должно начинаться с именной группы, поэтому, чтобы продолжить дерево, логично использовать правило построения предложения: Обратите внимание, что теперь синтаксический анализатор удерживает в памяти две неукомплектованных ветви: именная группа, для укомплектования которой требуется имя существительное, и предложение, для укомплектования которого требуется глагольная группа. Обособленная именная ветвь аналогична предсказанию того, что следующее слово должно быть именем существительным. И когда дело доходит до следующего слова dog ‘собака’, просмотр правил подтверждает такое предсказание: слово dog — это часть правила для имени существительного. Это позволяет слову dog быть включенным в дерево, укомплектовывая именную конструкцию: Синтаксическому анализатору больше не нужно помнить, что следует укомплектовать NP, все, что нужно держать в памяти, — это неукомплектованное S. На данном этапе можно в какой-то степени предположить значение предложения. Вспомните о том, что одно существительное в именной группе является ядром — вершиной (то, о чем говорит вся группа), а остальные синтаксические группы в составе именной могут определять это существительное. Найдя определения слов dog и the в их словарных статьях, синтаксический анализатор может отметить, что именная группа говорит о какой-то ранее упоминавшейся собаке. Следующее слово likes ‘любит’ оказывается глаголом. Глаголу неоткуда было взяться, кроме как из глагольной группы, VP, существование которой, к счастью, уже было предсказано, поэтому два этих элемента можно соединить друг с другом. Глагольная группа содержит больше, чем один глагол, она содержит также и именную группу (свое дополнение). Таким образом, синтаксический анализатор предсказывает, что следующее, с чем мы будем иметь дело — это именная группа: Следующее на очереди — ice-cream ‘мороженое’ — существительное, которое может быть частью именной группы — в точности как предсказывает обособленная ветвь NP. Последние кусочки головоломки идеально укладываются на свое место: Слово ice-cream ‘мороженое’ укомплектовало именную группу, поэтому ее нет необходимости больше держать в памяти; NP укомплектовала глагольную группу, поэтому и о ней тоже можно забыть, a VP укомплектовала предложение. Когда память освобождается от всех неукомплектованных обособленных ветвей, мы чувствуем в смзнании «щелчок», который свидетельствует о том, что мы только что услышали полностью укомплектованное грамматически правильное предложение. Одновременно с выращиванием ветвей дерева синтаксический анализатор также выстраивал значение предложения, используя определения в ментальном словаре и принципы их сочетаемости. Глагол является вершиной своей глагольной группы, поэтому VP говорит о любви к чему-либо. NP ice-cream ‘мороженое’ в составе VP является дополнением глагола. Словарная статья для слова likes ‘любит’ говорит о том, что дополнением к этому глаголу будет нечто, вызывающее любовь; отсюда следует, что VP сообщает о любви к мороженому. NP слева от спрягаемого глагола — это подлежащее; словарная статья для likes говорит о том, что подлежащим при этом глаголе будет то, что может испытывать любовь. Совмещая семантику подлежащего с семантикой VP, синтаксический анализатор определил, что в предложении утверждается факт любви вышеупомянутого представителя семейства псовых к замороженным сладостям. * * *Почему же так сложно запрограммировать компьютер на выполнение такой же операции? Почему и для людей она тоже внезапно становится трудной при чтении бюрократических документов и других образцов плохого стиля? Пройдя по предложению в роли синтаксического анализатора, мы столкнулись с двумя трудностями на пути к получению результата. Первая — это память: нам нужно было удерживать в памяти неукомплектованные группы, которые требовали для комплектации определенные виды слов. Вторая — это принятие решения: когда синтаксическая группа находилась с правой стороны двух различных правил, нам нужно было принять решение, какое из них использовать, чтобы вырастить следующую ветвь дерева. В соответствии с первым правилом искусственного интеллекта о легкости сложных проблем и сложности легких выходит, что часть, относящаяся к памяти, легка для компьютеров и тяжела для людей, а часть, относящаяся к принятию решений, легка для людей (по крайней мере, если предложение было правильно построено) и тяжела для компьютеров. Синтаксический анализатор предложения требует наличия многих видов памяти, но та, необходимость в которой очевиднее всего, — это память на неукомплектованные конструкции, запоминание того, что подвергается синтаксическому разбору. Компьютеры должны отвести для этой цели набор ячеек в своей памяти, так называемый «стеллаж»; ведь именно это и позволяет синтаксическому анализатору использовать грамматику структуры непосредственно составляющих, а не быть простым генератором цепочек слов. Люди также должны выделять некоторый объем своей оперативной памяти под неукомплектованные синтаксические группы. Но оперативная память — это и есть основное «узкое место» в процессе переработки человеком информации. Только несколько единиц — как правило — семь, плюс-минус две — могут одновременно удерживаться в сознании; и к тому же они немедленно начинают «растворяться», или их начинают вытеснять другие. На примере следующих предложений, вы можете увидеть, к чему приводит слишком долгое удерживание в памяти неукомплектованной группы:
Эти заставляющие память растягиваться предложения называются в пособиях по стилистике «предложениями с отягощенным началом». В языках, где о значении слов сообщают падежи, тяжелая составляющая может быть просто перенесена в конец предложения, чтобы слушатель мог переварить начало, не имея необходимости удерживать тяжелую составляющую в памяти. Английский язык деспотичен по отношению к порядку слов, но даже он предоставляет альтернативные варианты, в которых порядок составляющих будет изменен. Если внимательно подойти к составлению текста, то эти альтернативы можно использовать, чтобы отодвинуть самую тяжелую составляющую в конец, облегчая задачу для слушателя. Обратите внимание, насколько легче воспринимать эти предложения:
Многие лингвисты полагают, что языки допускают перестановку составляющих или предоставляют выбор из более или менее синонимичных высказываний для того, чтобы облегчить нагрузку на память слушателя. До тех пор, пока слова в предложении могут быть немедленно объединены в укомплектованные группы, предложение может быть довольно сложным, но тем не менее понятным:
Такие предложения называются «с ветвлением в правую сторону» из-за строения своего синтаксического дерева. Обратите внимание на то, что при продвижении слева направо только одна ветвь в один момент времени остается неукомплектованной: Предложения также могут иметь ветвление в левую сторону. Деревья с ветвлением в левую сторону больше всего распространены в языках с конечной позицией ядерного элемента, например, в японском, но также встречается и в некоторых английских конструкциях. Как и прежде, синтаксическому анализатору не нужно удерживать в памяти больше одной неукомплектованной ветви единовременно: букв. ‘Колибриного крыла движения скорость замечательна’. Есть и третий вид строения дерева, но он воспринимается гораздо тяжелее. Возьмите предложение:
Придаточное предложение that the motion has ‘которую имеет движение’ было вставлено в именную группу, содержащую The rapidity ‘Скорость’. То, что получилось в итоге, звучит немного неестественно, но легко поддается пониманию. Можно сказать и так:
Но если вставить группу motion that the wing has ‘движение, которым обладает крыло’ в группу rapidity that the motion has ‘скорость, которую имеет движение’, то результат будет на удивление трудно понять:
Если же вставить третью группу, например, the wing that the hummingbird has ‘крыло, имеющееся у колибри’, это приведет к появлению «предложения-капусты» с тройным вставлением, что выльется в невозможность его понять[99]: ‘Скорость, которую имеет движение, которым обладает крыло, которое имеет колибри, замечательна’. Когда синтаксический анализатор в голове у человека сталкивается с тремя has, идущими сразу друг за другом, он начинает буксовать, не зная, что с ними делать. Но проблема не в том, что составляющие, которые надо удерживать в памяти, слишком большие; даже короткие предложения не поддаются пониманию, если они содержат многочисленные вставления:
Почему человек терпит абсолютное фиаско, пытаясь истолковать предложения с «капустной» или «матрешечной» структурой? Это одна из наиболее интригующих головоломок, связанных с устройством ментального синтаксического анализатора и ментальной грамматики. Вначале можно даже усомниться в том, что эти предложения грамматически правильны. Может быть, мы перепутали правила, а настоящие правила никак не позволили бы этим словам сочетаться? Может быть, помянутый недобрым словом генератор цепочек слов из 4-й главы, отказывающийся помнить неукомплектованные составляющие, все же правильно имитирует человека? Никоим образом: эти предложения прекрасно выдерживают проверку. Именная группа может содержать определяющее ее придаточное предложение; если можно сказать the rat ‘та крыса’, то можно сказать и the rat that S ‘та крыса, что S’, где S — это предложение, в котором отсутствует объект, определяющий the rat. А предложение the cat killed X ‘кошка убила X’ может содержать именную группу, такую как его подлежащее — the cat. Поэтому, когда мы говорим The rat that the cat killed ‘Крыса, которую убила кошка’, мы определяем именную группу через то, что в свою очередь содержит именную группу. При наличии хотя бы только двух возможностей это сделать и могут появиться «капустные» предложения: стоит только определить именную группу внутри придаточного предложения другим определяющим придаточным предложением. Единственное, чем можно было бы предотвратить появление «капустных» предложений — это заявить, что ментальная грамматика предусматривает существование двух разных типов именных групп: одни из них могут быть определяемыми, а другие могут присутствовать в составе определяющего. Но так быть не может: в этом случае и тому и другому виду именных групп пришлось бы позволить иметь в своем составе тысячи одних и тех же существительных, а артиклям, прилагательным и притяжательным формам — занимать идентичные позиции и т.д. Количество словарных единиц не должно множиться без необходимости, а подобная работенка приведет именно к такому результату. Поместить в ментальной грамматике различные виды групп только для того, чтобы объяснить, почему «капустные» предложения не поддаются пониманию, значило бы сделать грамматику существенно сложнее и дать ребенку для заучивания существенно большее количество правил в период усвоения языка. Проблема должна крыться в чем-то другом. «Капустные» предложения показывают, что грамматика и грамматический синтаксический анализатор — это разные вещи. Человек может на подсознательном уровне «знать» те конструкции, которые он или она никогда не поймут, точно так же, как Алиса знала, что умеет складывать числа, несмотря на вердикт Черной Королевы:
Почему же синтаксический анализатор в голове у человека, похоже, сбивается со счета? Разве в оперативной памяти не достаточно места, чтобы удерживать одну или две неукомплектованных группы одновременно? Проблема должна быть более тонкой. Некоторые «капустные» предложения с трехслойной структурой несколько сложны из-за нагрузки на память, но их смысл далеко не так замутнен, как у предложений с has has has:
Не объем требуемой памяти ставит в тупик грамматический анализатор в голове у человека, но ее тип: удерживание в памяти той или иной составляющей и намерение вернуться к ней снова одновременно с анализом другой составляющей точно такого же типа. Примеры таких «рекурсивных» структур включают, например, относительное придаточное предложение внутри относительного придаточного того же типа и придаточное предложение условия (if… then) внутри другого придаточного условия. Создается впечатление, что синтаксический анализатор в голове у человека следит за тем, где в предложении появляется та или иная составляющая, но не расставляет неукомплектованные в данный момент составляющие, в том порядке, в котором они должны быть укомплектованы, а присваивает номер слоту рядом с каждым типом составляющей уже в контрольном списке. Если какой-либо тип составляющей приходится запоминать более одного раза, когда и первая составляющая (the cat that…), и одного с ней типа составляющая, внутри которой она находится — (the rat that…) могут быть укомплектованы по порядку, в контрольном списке уже не остается места, куда могли бы уместиться оба номера, и составляющие не могут быть укомплектованы должным образом. * * *В отличие от памяти, с которой плохо обстоят дела у людей и хорошо — у компьютеров, принятие решений — это та область, в которой люди сильны, а компьютеры слабы. Грамматика в предложении, которое я придумал, была простенькой — «игрушечной», а само предложение, по которому мы прошли шаг за шагом — «детским», таким, что для каждого слова в нем имелась только одна словарная статья (а само слово присутствовало в правой части только одного правила). Но стоит лишь открыть словарь — и вы увидите, у скольких имен существительных имеется вторая словарная статья, где эти слова рассматриваются как глаголы и наоборот. Например, слово dog ‘собака’ имеет вторую — глагольную — словарную статью, что видно из предложения Scandals dogged the administration all year ‘Скандалы сотрясали администрацию весь год’. Аналогично, в реальной жизни hot dog ‘булочка с горячей сосиской’ — это не только существительное, но и глагол, означающий ‘выпендриваться’. И каждый из глаголов в моей игрушечной грамматике также должен иметь вторую словарную статью со значением существительного, потому что носители английского языка могут говорить о дешевой eats ‘жратве’, чьих-либо likes и dislikes ‘любимых и нелюбимых вещах’ и о том, чтобы перехватить несколько bites ‘кусочков’. Даже слово-детерминатор one ‘один’, как в словосочетании one dog ‘одна собака’ может жить и жизнью существительного, как в словосочетании Nixon’s the one ‘Никсон — это тот [кто…]’. Эти локальные двусмысленности приводят грамматический анализатор в замешательство количеством ответвлений на каждом этапе продвижения вперед. Например, встречаясь со словом one в начале предложения, он не может просто построить но также должен держать в памяти Точно так же ему придется быстро выстроить две конкурирующие ветви, когда он столкнется со словом dog — одну на случай, если оно окажется существительным, другую — если глаголом. При встрече с one dog придется проверить четыре возможности: детерминатор-существительное, детерминатор-глагол, существительно-существительное и существительное-глагол. Конечно, вариант детерминатор-глагол может быть отклонен, поскольку его не допускает ни одно грамматическое правило, но все же его нужно проверить. Положение усложняется, когда слова объединяются в синтаксические группы, потому что последние могут входить в состав бо?льших синтаксических групп самыми разными способами. Даже в нашей игрушечной грамматике предложная группа (PP) может входить в состав как именной так и глагольной групп — как в двусмысленном высказывании discuss sex with Dick Cavett ‘обсуждать секс с Диком Кэветом’, автор которого предполагал, что PP with Dick Cavett ‘с Диком Кэветом’ будет входить в состав глагольной группы (обсуждать это с ним), но читатели могли истолковать ее как входящую в состав именной группы (секс с ним). Такие двусмысленности являются правилом, а не исключением; в каждой точке предложения могут встретиться десятки сотен вариантов, которые подлежат проверке. Например, обработав синтаксическую группу The plastic pencil marks… синтаксический анализатор встает перед четырьмя возможными вариантами: это могла быть именная группа из четырех слов, например: The plastic pencil marks were ugly ‘Пометки, сделанные пластиковым карандашом, были уродливы’ или именная группа из трех слов и глагол: The plastic pencil marks easily ‘Делать пометки пластиковым карандашом легко’[101]. В действительности, даже первые два слова The plastic… временно могут ввести в заблуждение; сравните: The plastic rose fell ‘Пластиковая роза упала’ и The plastic rose and fell ‘Пластик поднялся и упал’. Если бы приходилось только отслеживать все возможные варианты, появляющиеся в каждой точке, компьютер не испытывал бы особых сложностей. Он мог бы несколько минут пробуксовать на простом предложении или израсходовать так много оперативной памяти, что бумага с распечаткой результата протянулась бы до середины комнаты, но в итоге большинство вариантов, возможных в каждой точке, где принимается решение, вступили бы в противоречие с дальнейшей информацией, содержавшейся в предложении. А если так, то в конце предложения должны были бы обозначиться единственное дерево и связанные с ним значения, как это происходило в примере из игрушечной грамматики. Когда локальные двусмысленности не могут быть нейтрализованы, и для одного предложения продолжают быть актуальными два дерева, то мы встречаемся с предложением, которое люди находят двусмысленным, например:
Но вот в чем проблема. Компьютеры производящие грамматический разбор, настолько въедливы, что им самим это не идет на пользу. Они обнаруживают такие двусмысленности, которые вполне допустимы в рамках английской грамматики, но которые никогда не заметил бы человек, находящийся в здравом уме. Знаменитым примером тому служит один из первых компьютеров, производивших синтаксический разбор, разработанный в Гарварде в 60-е годы. Предложение Time flies like an arrow, конечно же, недвусмысленно, если только существуют недвусмысленные предложения (и если оставить в стороне разницу между буквальным и переносным значением, которые не имеют ничего общего с синтаксисом). Но к удивлению программистов остроглазый компьютер обнаружил в этом предложении пять различных деревьев!
Среди ученых-компьютерщиков это открытие было обобщено в афоризме: Time flies like an arrow, fruit flies like a banana (fruit ‘фрукт, фруктовый’, banana ‘банан’). Или задумайтесь о строчке из песни: Mary had a little lamb ‘У Мэри был ягненок’. Недвусмысленно? Вообразите, что вторая строчка такова: With mint sauce ‘С мятным соусом’ или: And the doctors were surprised ‘И врачи были удивлены’ или: The tramp! ‘Проститутка!’[103]. Структура может существовать даже в кажущемся бессмысленным наборе слов. Например, приведенная ниже вычурная цепочка слов, придуманная моей студенткой Энни Сенгас — грамматически правильное предложение:
Американский бизон носит название buffalo. Бизон родом из Buffalo, штат Нью-Йорк, может быть назван Buffalo buffalo. Вспомните также, что есть и глагол to buffalo, означающий ‘разгромить, победить’. Вообразите, что бизоны из штата Нью-Йорк побеждают друг друга: (The) Buffalo buffalo (that) Buffalo buffalo (often) buffalo (in turn) buffalo (other) Buffalo buffalo — (Тот) Buffalo buffalo (который) Buffalo buffalo (часто) buffalo (в свою очередь) buffalo (другого) Buffalo buffalo. Психолингвист и философ Джерри Фодор заметил, что речевка футбольной команды Иельского университета:
это грамматически правильное предложение, хотя и с тройным вставлением в середине. Как же людям удается правильно проанализировать предложения, не отвлекаясь на грамматически допустимые, но неестественные альтернативы? Существуют два возможных объяснения. Первое: наш мозг устроен по образцу компьютерного синтаксического анализатора, который обрабатывает десятки не имеющих будущего фрагментов дерева на заднем плане, и те фрагменты, которые кажутся неприемлемыми, каким-то образом отфильтровываются прежде, чем они достигнут сознания. Второе объяснение: синтаксический анализатор в голове у человека на каждой ступени анализа каким-то образом взвешивает, какая альтернатива является наиболее вероятной, и потом пропахивает дорогу вперед, насколько это возможно, для этого единственного толкования. Ученые-компьютерщики называют такие возможности «вторичный поиск» и «первичный поиск». Похоже, что на уровне отдельных слов мозг сначала проводит вторичный поиск, принимая во внимание, хотя и не надолго, несколько возможных словарных статей для двусмысленного слова, даже тех, которые вряд ли могут оказаться правильными. Во время одного хитроумного эксперимента психолингвист Дэвид Суинни давал людям прослушать через наушники отрывки следующего типа:
Заметили ли вы, что предложение содержит двусмысленное слово bug ‘жучок’, которое может означать, как insect ‘насекомое’, так и surveillance device ‘аппарат для слежки’. Скорее всего, нет; второе значение более затуманено и не имеет смысла в данном контексте. Но психолингвистов интересуют ментальные процессы, которые длятся лишь миллисекунды и требуют при работе с ними более тонкой технологии, чем простое задавание вопросов. Как только слово «жучок» звучало на пленке, компьютер высвечивал на экране некоторое слово, и человеку нужно было нажать кнопку, как только он это слово узнавал. (Другая кнопка была для слов, реально не существующих, например, blick.) Хорошо известно, что когда человек слышит какое-либо слово, то ему легче узнать другое слово, если оно имеет отношение к первому, как если бы ментальный словарь был организован по принципу словаря тематического — когда находишь одно слово, другие, близкие по значению, находятся быстрее. Как и ожидалось, люди быстрее нажимали кнопку, узнавая слово «муравей», которое близко по значению к «жучку», чем слово «шить», которое с ним никак не связано. Как это ни странно, люди с почти такой же быстротой узнавали слово «шпион», которое, конечно, связано с жучком, но только в другом его значении, не имеющем смысла в контексте. Это предполагает то, что мозг с ходу выдает обе словарные статьи для слова «жучок», несмотря на то, что одну из них было бы разумно заранее отклонить. Неподходящее значение не задерживается в сознании надолго: когда контрольное слово появлялось на экране через три слога после «жучка», а не сразу после него, быстро узнавалось только слово «муравей», «шпион» больше не опережал «шить» по быстроте узнавания. Возможно именно поэтому люди отрицают, что они хоть как-то принимают во внимание неподходящее значение. Психологи Марк Зейденберг и Майкл Танненхаус продемонстрировали тот же эффект в отношении слов, которые были двусмысленны благодаря своей принадлежности одновременно к разным частям речи, как, например, слово tires ‘шины’ или глагол ‘устать’ в 3-м лице единственного числа, с которым мы встречались в двусмысленном заголовке Stud Tires Out ‘Жеребец выбился из сил’ или ‘Шины жеребца оказались снаружи’. Вне зависимости от того, появлялось ли слово в значении существительного: The tires… или в значении глагола: He tires…, это слово вызывало ассоциации как со словом wheels ‘колеса’, которое имеет отношение к именному значению, так и со словом fatigue ‘усталость’, которое имеет отношение к глагольному значению. Таким образом, поиск в ментальном словаре происходит быстро и тщательно, но не слишком осмысленно, поскольку извлекаются не имеющие смысла словарные статьи, которые должны быть позднее отсеяны. На уровне синтаксических групп и предложений (хотя они и охватывают много слов) люди наверняка не рассматривают все возможные варианты деревьев данного предложения. Мы знаем это благодаря двум фактам. Во-первых, многие явные двусмысленности просто никогда не распознаются как таковые. Чем еще можно объяснить двусмысленности в газетных отрывках, ускользнувшие от редакторов и наверняка ужаснувшие их потом? Я не могу отказать себе в удовольствии привести еще немного цитат:
Однажды я прочитал аннотацию на обложке книги, где говорилось, что автор живет со своим мужем, архитектором и музыкантом-любителем, в Чешире. Какое-то мгновение я думал, что это была шведская семья из четырех человек. Иногда люди не только не замечают другие присутствующие в предложении древесные структуры, но и упорно не хотят замечать единственно возможную. Возьмите следующие предложения:
Большинство людей спокойно продвигаются по предложению до определенной точки, потом попадают в тупик и отчаянно оглядываются назад на предшествующие слова, пытаясь вычислить, где они сбились с пути. Зачастую их попытки проваливаются, и люди начинают считать, что на конце эти предложения имеют лишнее слово, или что половинки двух предложений были механически сведены вместе. В действительности, каждое из этих предложений грамматически правильно:
Такие предложения называются «обманками» («garden path sentences») потому что их первые слова направляют слушателя не в том направлении к неверному анализу. «Обманки» показывают, что люди, в отличие от компьютеров, не выстраивают все возможные деревья по мере анализа предложения; если бы они это делали, то правильная структура была бы среди них. Скорее всего, люди обычно используют стратегию первичного поиска, выбирая тот вид анализа, который кажется работающим правильно, и следуя в его русле, пока это возможно. Если какие-то из встретившихся слов нельзя присоединить к дереву, то человек возвращается в исходную точку и начинает выстраивать другое дерево. (Иногда люди, особенно обладающие хорошей памятью, могут одновременно иметь в виду второе дерево, но огромное множество всех возможных деревьев никогда не задействуется.) Стратегия первичного поиска делает ставку на то, что дерево, на котором можно было размещать слова до сих пор, будет позволять размещать их и в дальнейшем; таким образом, при этой стратегии экономится объем памяти благодаря сохранению в ней только одного дерева. Однако расплатой за это может стать необходимость начать все сначала, если ставка сделана не на ту лошадь, которая скакала вдоль амбара. Между прочим, обманки — одна из самых ярких черт плохого стиля. Предложения создаются без четких указателей на каждом разветвлении, позволяющих читателю уверенно продвигаться до самого конца. Вместо этого читатель постоянно оказывается в тупике и вынужден отступать назад. Вот несколько примеров, которые я выбрал из газет и журналов:
По контрасту с этим великие писатели, такие как Шоу, могли направить читателя по прямой от первого слова в предложении до последнего, даже если между ними пролегало 110 слов. * * *Тот, кто производит синтаксический разбор способом первичного поиска, должен использовать какой-то критерий, чтобы выбрать одно-два дерева и придерживаться одного из них; в идеале это будет дерево, наиболее приближенное к правильному варианту. Один вариант того, как это сделать — это использовать весь объем человеческого интеллекта, и анализировать предложение «сверху вниз». В соответствии с этим вариантом люди не задаются целью выстроить все ветви дерева, если они заранее могут предсказать, что эти ветви не будут иметь смысла в данном контексте. Среди психолингвистов шли большие дискуссии о том, разумно ли предполагать, что именно так работает синтаксический анализатор в голове у человека. В том смысле, что разум слушателя может правильно предсказать речевые намерения говорящего, анализ «сверху вниз» может направить синтаксический анализатор к правильному пониманию предложения. Но объем человеческого интеллекта слишком велик, и задействование его всего одновременно может слишком замедлить синтаксический разбор, происходящий синхронно с проносящимся мимо вихрем слов. Джерри Фодор, цитируя Гамлета, предполагает, что если бы знаниям и контексту приходилось задавать направление грамматическому разбору, то «на естественное озарение нашла бы тень мысли». Он предположил, что грамматический анализатор — это автономный модуль, который обращается за информацией только к ментальной грамматике и ментальному словарю, а не ментальной энциклопедии. Окончательно этот вопрос должен быть решен экспериментальным путем. Представляется вероятным, чтобы синтаксический анализатор в голове у человека использовал хоть какие-то знания об окружающем мире. В эксперименте психологов Джона Трусвелла, Майкла Танненхауса и Сьюзен Гарнси людям предлагалось закусить некую планку, чтобы они не имели возможности двигать головой, и прочесть предложения на экране компьютера, при этом шла запись движения их глаз. В предложениях были потенциальные обманки. Прочтите, например, такое предложение:
На мгновение вас могло сбить с толку слово by, потому что до этой точки в предложении могло скорее говориться о том, что что-то выяснил сам подзащитный, а не то, что что-то выяснили о нем. И действительно, взгляд испытуемых задерживался на слове by и был готов вернуться к началу предложения, чтобы его переосмыслить (по сравнению с контрольными недвусмысленными предложениями). А теперь прочтите следующее предложение:
Если обманок помогает избежать здравый смысл, то с этим предложением дела должны обстоять гораздо проще. Показания, в отличие от подзащитных, не могут сами ничего выяснять, поэтому потенциально можно избежать появления неверного дерева, где показания стали бы что-либо выяснять. И люди действительно обходятся без него: глаза испытуемых пробегали по предложению лишь с небольшими задержками и возвратами назад. Конечно, задействованное знание достаточно примитивно (подзащитные могут что-то выяснить, а показания — нет), а соответствующее ему дерево было очень легко найти по сравнению с десятками деревьев, которые может найти компьютер. Поэтому никто не знает, какой именно объем общих знаний человека задействуется в процессе понимания предложений в режиме реального времени; это широкое поле для исследований. Сами слова тоже могут указать, как нужно производить анализ. Вспомните о том, что каждый глагол предъявляет требования к составляющим глагольной группы (например, вы не можете просто devour, вы должны devour something ‘пожирать что-либо’; вы не можете dine something, вы можете просто dine ‘ужинать’). Самая распространенная словарная статья для глагола как будто подталкивает синтаксический анализатор к поиску ролевых исполнителей, которые требуются глаголу. Трусвелл и Танненхаус изучали движение глаз добровольных участников эксперимента в то время, как те читали:
Дойдя до слова was взгляд участников эксперимента задерживался на нем, а потом прыгал обратно, поскольку люди неправильно истолковывали предложение, как говорившее о студенте, забывшем решение, точка. Очевидно, слово forget ‘забывать’ в голове у людей говорило синтаксическому анализатору: «Немедленно найди мне дополнение!» Другое предложение было таким:
На сей раз проблем не было, потому что слово hope ‘надеяться’ вместо этого говорило: «Найди мне придаточное предложение!», и предложение было тут как тут. Слова могут также помочь грамматическому анализатору, подсказывая, какие именно другие слова, как правило, появляются вместе с ними в составе определенной синтаксической группы. Хотя вероятностные переходы от слова к слову недостаточны для понимания предложения (глава 4), они могут оказаться полезны: когда синтаксический анализатор снабжен хорошей статистикой, то выбирая между двух возможных деревьев, допускаемых грамматикой, он может остановиться на той структуре, которая наверняка и имелась в виду. Синтаксический анализатор, похоже, проявляет чувствительность к вероятности образования пары слов: многие обманки особенно легко направляют по ложному следу, поскольку в них имеются такие распространенные пары слов, как cotton clothing ‘одежда из хлопка’, fat people ‘толстые люди’ и prime number ‘простое число’. Выигрывает мозг от языковой статистики или нет, но компьютеры выигрывают точно. В лабораториях AT&T и IBM компьютеры заносят в таблицы миллионы слов текста из таких источников как «Уолл-стрит джорнал»[104] и «Ассошиэйтед пресс». Инженеры надеются, что если они снабдят свои синтаксические анализаторы сведениями о частотности сочетаемости слов и групп слов друг с другом, то синтаксические анализаторы смогут разумно избежать двусмысленностей. Наконец, люди прокладывают себе путь через предложение, ориентируясь на деревья определенной формы — своего рода фигурная стрижка кустов в ментальном исполнении. Один из принципов, которым при этом руководствуются — это инерция: людям нравится нагружать новыми словами ветви, свободные в данный момент времени, вместо того, чтобы закрыть одну и перепрыгнуть к другой, ненагруженной, на более ранней ветви. Эта стратегия «позднего закрытия» может объяснить, почему мы попадаемся на обманку в предложении:
Это предложение грамматически правильно и имеет смысл, но нужно посмотреть на него дважды или трижды, чтобы это осознать. Нас вводит в заблуждение то, что когда мы доходим до наречия yesterday ‘вчера’, мы пытаемся разместить его внутри открытой в настоящий момент VP do the work ‘сделает работу’, вместо того, чтобы закрыть эту VP и разместить данное наречие выше, где оно будет в составе той же синтаксической группы, что и Flip said ‘Флип сказал’. (Кстати, обратите внимание на то, что наше знание реалий, например таких, что значение показателя будущего времени will несовместимо со значением yesterday ‘вчера’, не удержало нас от того, чтобы попасться на обманку. Это предполагает, что весь объем общих знаний ограничен в своих возможностях привести нас к правильному пониманию предложения.) Вот еще один пример, на этот раз ответственность за него несет психолингвист. Энни Сенгас не придумывала этот пример специально, просто однажды она произнесла: The woman sitting next to Steven Pinker’s pants are like mine. (Энни имела в виду, что брюки женщины, сидящей рядом со мной, были такими же, как у нее.)[105] Второй принцип — это экономия: люди стараются присоединить составляющую к дереву, используя как можно меньше ветвей. Этим объясняется то, почему мы попадаемся на обманку в предложении:
Требуется только одна ветвь для того, чтобы ввести слово countess ‘графиня’ в VP, где ее будет подозревать Шерлок, и две ветви — чтобы ввести ее в S, которое само введено в состав VP, чтобы Шерлок подозревал графиню в мошенничестве: Похоже, что ментальный синтаксический анализатор стремится минимизировать процесс введения составляющих, хотя в дальнейшем предложение покажет, что это неправильно. * * *Поскольку предложения двусмысленны, но законы и контракты должны быть изложены в предложениях, принципы синтаксического разбора могут сильно повлиять на человеческие судьбы. Лоренс Солэн в своей последней книге комментирует много примеров. Рассмотрим следующие отрывки: первый из договора страхования, второй — из устава, третий — из инструкции присяжным:
В первом случае женщина, разъяренная тем, что в ресторане ее оставил партнер, уехала на машине, которая, как она считала, была его кадиллаком. Машина, которая затем была разбита, оказалась принадлежащей кому-то другому, и женщина обратилась за возмещением ущерба в страховую компанию. Выплатили ли ей страховку? Апелляционный суд Калифорнии сказал «да». Суд отметил, что в полисе содержалась двусмысленность, поскольку требование с разрешения владельца, которое безусловно не было выполнено, можно было истолковать, как относящееся исключительно к словам любым лицом, ответственным за использование транспортного средства от имени застрахованного лица скорее, чем к словам застрахованным лицом (подразумевается — этой женщиной) и любым лицом, ответственным за использование транспортного средства от имени застрахованного лица. Во втором случае наркоделец пытался обмануть клиента (к несчастью для себя — тайного агента полиции), продав ему пакетик нейтрального порошкового вещества с мельчайшей примесью метамфитамина. Вещество представляло «потенциальную угрозу», а количество вещества — нет. Был ли нарушен закон? Апелляционный суд сказал, что да. В третьем случае подзащитный обвинялся в изнасиловании и убийстве пятнадцатилетней девушки, и присяжные вынесли смертный приговор. Конституционный закон Соединенных Штатов запрещает любую инструкцию, которая бы отказывала подзащитному в том, чтобы присяжные руководствовались любым «фактором симпатии», открывшимся в ходе следствия, который в данном случае состоял в психологических проблемах и происхождении из неблагополучной семьи. Действительно ли данная инструкция вопреки конституции лишала обвиняемого права на симпатию, или только на менее значительную исключительно симпатию! Верховный Суд Соединенных Штатов проголосовал пять к четырем, что обвиняемому было отказано только в исключительно симпатии, отказ соответствовал конституции. Солэн указывает, что суды часто решают такие случаи, полагаясь на «каноны толкования», приведенные в юридической литературе и соответствующие принципам синтаксического разбора, которые я обсуждал в предыдущем разделе. Например, Правило Последнего Предшествующего, которое суды использовали принимая решение в двух первых случаях, это просто правило «минимального приписывания» — стратегия, которую мы только что наблюдали в предложении о Шерлоке Холмсе. Таким образом, принципы ментального синтаксического разбора имеют буквально жизненно важные последствия. Но те психолингвисты, которые волнуются, что их следующий эксперимент может отправить кого-нибудь в газовую камеру, могут вздохнуть свободно. Солэн замечает, что судьи — не слишком хорошие лингвисты: к добру или к худу они стараются всячески обойти самое естественное толкование, если оно противоречит тому решению, которое они считают правильным. * * *Я веду разговор о деревьях, но предложение — это не просто дерево. С начала 60-х годов, когда Хомский предложил трансформации, конвертирующие глубинные структуры в поверхностные, психологи использовали лабораторные технологии, чтобы попытаться обнаружить какой-нибудь «отпечаток пальцев», оставленный трансформацией. После неоднократно имевшего место преждевременного ликования эти попытки были заброшены, и на несколько десятилетий учебники по психологии дали отставку трансформации за то что она не имеет «реального психологического обоснования». Но лабораторные технологии стали более совершенными, и обнаружение того, что напоминает трансформационную операцию в сознании людей — это одно из самых интересных недавних открытий в психологии языка. Возьмем предложение:
Кто был обвинен в преступлении? Конечно, мальчик, хотя слова the boy ‘мальчика’ не следуют после accused ‘обвинили’. По Хомскому это происходит из-за того, что синтаксическая группа, относящаяся к the boy, действительно следует после accused ‘обвинили’ в глубинной структуре; она была смещена назад, на позицию слова that ‘которого’, трансформацией, оставившей после себя безмолвный «след». Тот, кто пытается понять это предложение, должен отменить действие, произведенное трансформацией, и мысленно поместить копию синтаксической группы назад на место следа. Чтобы это сделать, нужно сперва, находясь в начале предложения, заметить, что существует перемещенная синтаксическая группа — the boy — которую нужно вернуть на место. Эту синтаксическую группу нужно удерживать в оперативной памяти, пока не обнаружится пробел — позиция, где должна присутствовать, но не присутствует составляющая. В данном предложении существует пробел после слова accused, поскольку accused требует дополнения, а его нет. Можно сделать заключение, что пробел содержит след, а затем извлечь синтаксическую группу the boy из оперативной памяти и связать ее со следом. Только после этого человек может вычислить, какую роль the boy играл в происходящем: в данном случае его обвиняли. Замечательно то, что каждый из этих ментальных процессов можно измерить. На протяжении словесного интервала между перемещенной составляющей и следом (подчеркнутая область) люди должны удерживать составляющую в памяти. Это усилие должно проявляться в менее хорошем исполнении любого синхронно выполняемого задания, связанного с мыслительной активностью. И действительно, в то время, пока люди выполняют это задание, они замечают сигналы извне (например, вспышку, мелькнувшую на экране) медленнее, и им труднее удержать в памяти набор других слов. Даже их ЭЭГ (электроэнцефалограммы или записи электронной активности мозга) показывает результаты напряжения. Затем, на этапе, когда след обнаружен и память можно разгрузить, «выгруженная» оттуда синтаксическая группа появляется на ментальной сцене, что можно обнаружить несколькими способами. Если экспериментатор высвечивает какое-то слово из перемещенной синтаксической группы (например, boy) на этой стадии, люди узнают его быстрее. Они также быстрее узнают слова, имеющие отношение к перемещенной синтаксической группе — например, girl ‘девочка’. Этот эффект настолько ощутим, что его можно наблюдать на записи мозговых волн; если толкование следа оказывается неадекватным, как, например, в предложении:
то ЭЭГ показывает замешательство в точке, соответствующей следу. Установление связи составляющих со следами — это захватывающая вычислительная операция. Удерживая составляющую в памяти, синтаксический анализатор должен постоянно отыскивать след — невидимое и неслышимое ничто. Невозможно предсказать, насколько далеко в предложении появится след, а иногда он появляется довольно далеко:
И пока след не обнаружен, семантическая роль синтаксической группы — это нераскрытая карта, особенно теперь, когда отличие who ‘кто’ от whom ‘кто’ (в косвенных падежах) фонографом уже не отмечается.
Проблема настолько серьезна, что хорошие стилисты и даже сама грамматика языка предпринимают шаги к тому, чтобы ее облегчить. Один из принципов хорошего стиля — это минимизировать объем той части предложения, на протяжении которой перемещенная составляющая должна удерживаться в памяти (подчеркнутые части). Для этой цели в английском хороша пассивная конструкция (несмотря на настоятельные рекомендации избегать ее, которые дают компьютерные «проверки стиля»). В следующей паре предложений пассивный вариант легче, поскольку занимающая память часть перед следом короче:
И повсеместно грамматики ограничивают ту область дерева, по которой может перемещаться составляющая. Например, можно сказать:
Но следующее предложение звучит достаточно странно:
У языков имеются «связывающие» ограничения, превращающие некоторые синтаксические группы, подобные сложным именным группам, например: the rumor that Mary likes him в «острова», с которых не может скрыться ни одно слово. Это преимущество для слушателей, поскольку синтаксический анализатор знает, что говорящий ничего не мог вывести из состава этой синтаксической группы, и ему не нужно отслеживать след. Но преимущество для слушающего означает нагрузку на говорящего: в такие предложения нужно включать неуклюжее дополнительное местоимение: That’s the guy that you heard the rumor that Mary likes him ‘Вот тот парень, о котором вы слышали молву, что Мэри его любит’. * * *Синтаксический разбор, несмотря на всю его важность, это только первый шаг в понимании предложения. Вообразите синтаксический разбор следующего диалога, взятого из реальной жизни:
Этот диалог имел место 17 марта 1973 г. между президентом Ричардом Никсоном (П), его советником Джоном У. Дином 3-м (Д) и главой администрации X. Р. Холдеманом (X). Ховард Хант, работавший на президента во время его второй предвыборной кампании в июне 1972 г. организовал насильственное вторжение в штаб Демократической партии, находившийся в здании Уотергейт, где его люди установили жучки на телефонах председателя партии и других сотрудников. Должно было быть проведено несколько расследований, чтобы выяснить, кто в Белом Доме дал указ провести операцию: Холдеман или Федеральный прокурор Джон Митчелл. Участники диалога обсуждали, заплатить ли 120 000 «связывающих язык» долларов Ханту прежде, чем он даст показания большому жюри. Этот диалог имеется у нас в дословном виде, поскольку в 1970 г. Никсон, заявляя, что действует от имени будущих историков, установил жучки в своем собственном кабинете и начал тайно записывать все свои разговоры. В феврале 1974 г. Комитет по юридическим вопросам Палаты представителей предоставил записи суду, чтобы с их помощью было определено, должен ли Никсон подвергнуться импичменту. Данный отрывок — из расшифровки этих записей. Во многом на основании этого отрывка комитет рекомендовал импичмент. Никсон ушел в отставку в августе 1974 г. Записи, относящиеся к Уотергейту — одни из самых больших и известных расшифровок реальной речи, которые когда-либо были опубликованы. Когда они появились в печати, американцы были потрясены, хотя причины этого потрясения были разными. Некоторых, очень небольшое количество людей, потрясло, что Никсон принимал участие в тайных махинациях с целью обмануть правосудие. Другие были в шоке от того, что лидер свободного мира ругается как извозчик. Но все без исключения были поражены тем, как выглядит обычная речь, когда она записана дословно. Смысл разговора вне контекста совершенно не понятен. Часть проблемы связана с расшифровкой записи: потеряны интонация и временны?е промежутки, отделяющие друг от друга синтаксические группы, а расшифровка записи с какой-либо другой пленки, кроме пленки самого высокого качества, ненадежна. И действительно, при независимой расшифровке этой низкого качества записи в Белом Доме некоторые загадочные моменты обретают смысл. Например, I want the, uh, uh, to go расшифровывается как I want them, uh, uh, to go. Но даже при идеальной расшифровке запись беседы трудно понять. Люди часто говорят отрывками, прерывая самих себя на середине предложения, чтобы переформулировать мысль или сменить тему. Зачастую непонятно, о ком или о чем говорят, потому что говорящие употребляют местоимения (ему, им, этот, то, мы, они, это обо всем), общие слова (эта история, в этом отношении, такое, эти люди, все было сделано) и элипсисы (кабинет Федерального прокурора сделает, вот поэтому). Намерения не выражаются напрямую. В данном отрывке то, будет ли человек к концу года президентом Соединенных Штатов или обвиненным преступником, буквально зависело от смысла сделать это так, что и от того, была ли фраза Что вам нужно для того, чтобы? запросом об информации или скрытым предложением чего-либо. Но непонятность расшифровки речи потрясла не всех. О ней прекрасно известно журналистам; усиленно редактировать цитаты и интервью перед публикацией — это обычное дело. В течение многих лет темпераментный питчер бостонской команды «Ред Сокс» Роджер Клеменс отчаянно сетовал на то, что его неправильно цитируют в прессе. Газета «Бостон Херольд» ответила на это шуткой, о жестокости которой не могла не знать: в одной из статей комментарии Клеменса, сделанные после игры, были приведены дословно. Редактирование журналистами записей бесед приобрело законную силу в 1983 г., когда писательница Дженет Малколм опубликовала в журнале «Нью-Йоркер» серию нелестных статей о психоаналитике Джеффри Мэссоне. Мэссон написал книгу, обвиняющую Фрейда в нечестности и трусости за отказ последнего от своего утверждения о том, что невроз вызван пережитым в детстве сексуальным насилием. За это Мэссон был уволен с должности хранителя архивов Фрейда в Лондоне. По словам Малколм, в данных ей интервью Мэссон описывал себя как «жиголо в области интеллекта», «величайшего психоаналитика когда-либо жившего после Фрейда» и говорил о своих планах превратить дом Анны Фрейд после ее смерти в «место для секса, женщин и развлечений». Мэссон предъявил Малколм и «Нью-Йоркер» иск на 10 миллионов долларов, утверждая, что он никогда такого не говорил, а остальные цитаты были искажены, чтобы выставить его на посмешище. Хотя Малколм не могла привести свидетельства истинности цитат ни с пленки, ни из своих записей, она отрицала то, что они были просто придуманы, а ее адвокаты настаивали на том, что даже если цитаты и были придуманы, они были «разумным толкованием» того, что говорил Мэссон. Они утверждали, что поправка цитат — это обычная журналистская практика, а не пример публикации заведомо ложных сведений или опрометчивого пренебрежения фактом их ложности, что является частью понятия «клевета». Несколько судов отказались от этого дела на основании первой поправки к Конституции[107], но в июне 1991 г. Верховный суд единогласно постановил вновь принять это дело к рассмотрению. В заключении суда, принятом после тщательного рассмотрения дела, большинством были определены основные положения, регламентирующие то, как журналистам следует обращаться с цитатами. (Требование публиковать цитаты дословно даже не рассматривалось.) Судья Кеннеди, выступавший от имени большинства, сказал, что «обдуманное изменение слов, произнесенных истцом это не одно и то же, что предоставление ложных сведений» и что «Если какой-либо автор изменяет произнесенные кем-то слова, но это не влияет существенно на смысл, то репутация произнесшего слова не страдает. Мы отказываем в проведении какой-либо специальной проверки цитат на ложность, включая проверку, которая не рассматривала бы грамматические и синтаксические исправления». Если бы Верховный суд задал вопрос мне, то я бы принял сторону судей Уайта и Скалии, призывавших не учитывать такие исправления. Как и многие лингвисты, я сомневаюсь, что можно исказить чьи-либо слова (включая большую часть грамматики и синтаксиса), не изменив существенно смысл. Такие случаи демонстрируют, что реальная речь бесконечно далека от The dog likes ice-cream ‘Эта собака любит мороженое’ и что в понимании предложения заключено гораздо больше, чем простой грамматический разбор. Процесс понимания использует информацию о смысле, почерпнутую из дерева в качестве лишь одного из параметров в сложной цепи заключений о намерениях говорящего. Почему так происходит? Почему в процессе речи даже честные люди редко произносят правду, одну только правду и ничего, кроме правды? Первая причина — это эфирное время. Разговор застрянет на месте, если кто-либо будет говорить о Специальном отборочном комитете сената Соединенных Штатов в Деле о вторжении в здание Уотергейт и сопутствовавшем саботаже, каждый раз произнося полное название. Достаточно такого эквивалента, как the Ervin thing ‘эта проблема с Эрвином’ или просто it ‘это’. По той же причине будет просто потерей времени выписывать следующую логическую цепочку:
Гораздо эффективнее сказать: «Чтобы обойтись без проблем сейчас, у нас нет выбора в отношении Ханта, кроме как сто двадцать или около того». В то же время эффективность зависит от того, обладают ли участники диалога одними и теми же базовыми знаниями о некоторых событиях и о психологии человеческого поведения. Они должны использовать эти знания для перекрестных ссылок на имена, местоимения и описания, с которыми связан один и тот же набор действующих лиц и для выстраивания логических мостов от одного предложения к другому. Если базовые знания не являются общими для участников диалога, например, если собеседник принадлежит к совершенно другой культуре, или он шизофреник, или машина, то самый лучший синтаксический разбор в мире не сможет передать значение предложения. Некоторые ученые-компьютерщики попытались включить в свои программы маленькие «сценарии», действие в которых происходит в таких типичных местах, как ресторан или празднование дня рождения, чтобы помочь программе заполнить недостающие части того текста, который она пытается понять. Другая группа ученых пытается научить компьютер основам человеческого здравого смысла, который по их оценкам подразумевает знание около десяти миллионов фактов. Чтобы проникнуться тем, насколько неподъемная это задача, подумайте, сколько знаний о человеческом поведении должно быть задействовано для понимания слова он в следующем простом диалоге:
Таким образом, понимание требует интеграцию фрагментов, извлеченных из предложения, в обширную ментальную базу данных. Чтобы это было результативно, говорящий не может просто помещать один факт за другим в голову слушающего. Знание — это не просто перечень фактов, как в рубрике новостей, а сложно организованная система. Когда факты выстраиваются последовательно, как, например, в диалоге или тексте, язык должен быть структурирован так, чтобы слушающий мог разместить каждый факт в рамках уже существующей схемы. Отсюда следует, что информация о чем-то давно известном, данном, понятом, относящемся к предмету обсуждения (тема) должна появляться в начале предложения, как правило соответствуя подлежащему, а информация о чем-то новом, том, на чем сосредоточено внимание, чему дается оценка, должна идти в конце[108]. Размещение темы в начале предложения — это еще одна функция злополучного пассивного залога. В своей книге по стилистике Уильямс замечает, что обычный совет «Избегайте пассивного залога» может быть проигнорирован, когда ролевая позиция темы связана с глагольным дополнением глубинной структуры. Например, прочтите такой состоящий из двух предложений отрывок текста:
Кажется, что второе предложение не вытекает из первого логически. Гораздо лучше поставить его в пассивном залоге:
Теперь второе предложение прекрасно подходит к первому, поскольку его подлежащее — черная дыра — это тема, а сказуемое добавляет к этому новую информацию. В развернутой беседе или эссе хороший стилист, будет делать рему одного предложения, темой другого, выстраивая суждения в последовательную цепочку. При изучении того, как предложения вплетаются в дискурс и истолковываются в контексте (такое изучение иногда называют «прагматикой»), было сделано интересное открытие, на которое впервые указал философ Пол Грайс и которое недавно усовершенствовали антрополог Дэн Спербер и лингвист Дейрдр Уилсон. Акт коммуникации полагается на ожидание сотрудничества как со стороны слушающего, так и со стороны говорящего. Сообщив что-либо драгоценным ушам слушающего, говорящий в неявной форме гарантирует, что сообщенная информация адекватна: она не повторяет то, что уже известно, и в достаточной степени соответствует тому, из чего, по мысли слушателя, можно сделать новые выводы, прилагая лишь небольшие дополнительные умственные усилия. Отсюда следует, что слушающий подсознательно ожидает от говорящего информативности, правдивости, адекватности, ясности, недвусмысленности, краткости и упорядоченности. Такие ожидания помогают отсеять неправильные прочтения двусмысленного предложения, составить единое целое из разрозненных высказываний, не заметить оговорки, догадаться, к чему относятся местоимения и описания и заполнить недостающие моменты в разговоре. (Когда адресат сообщения не проявляет готовности к сотрудничеству, вся отсутствующая информация должна быть выражена в явной форме, вот почему мы имеем изощренный язык юридических договоров с их перлами типа: «лицо, выступающее от имени первой стороны» и «все права в соответствии с данным авторским правом и все обновления таким образом являются предметом условий настоящего соглашения».) Одно интересное открытие состоит в том, что правила адекватной коммуникации часто проявляются при нарушении таковых. Говорящие намеренно игнорируют их в буквальном содержании своей речи так, чтобы слушающий сам мог вставить предположения, восстановившие бы в коммуникации адекватность. Такие предположения могут быть по-настоящему информативны. Знакомый пример — это следующий вид рекомендательного письма:
Хотя в письме не содержится ничего, кроме положительных фактических замечаний, оно гарантирует, что г-н Смит не получит ту должность, на которую рассчитывает. Письмо не содержит никакой информации, адекватной ожиданиям читателя, и этим самым нарушает правило информативности. Читатель исходит из того, что весь акт коммуникации целиком предполагает адекватность, и если содержание письма адекватным не является, то читатель сам привносит ту информацию, которая сделает коммуникацию адекватной: автор письма не может сообщить ничего положительного. Но зачем же последнему весь этот политес вместо того, чтобы просто сказать: «Держитесь от Смита подальше, он туп как пробка»? Благодаря другой информации, которой читатель также может дополнить акт коммуникации: автор — это человек, который не станет походя обижать тех, кто ему доверился. Это естественно, что люди используют ожидания, необходимые для успешной коммуникации, как способ спрятать свои реальные намерения в нескольких слоях скрытого смысла. Человеческая коммуникация — это не два аппарата факсимильной связи, соединенных проводом, это изменчивое отражение поведения строящих тайные планы и обладающих даром предвосхищения социальных животных. Когда мы доносим слова до слуха людей, мы приходим с ними во взаимодействие и открываем наши собственные намерения, благородны они или нет, так же явно, как если бы между нами и этими людьми был физический контакт. Нигде это нельзя наблюдать в более явном виде, чем в тех замысловатых отклонениях от обычного языка, которые встречаются в каждом обществе и называются вежливостью. Если высказывание: «Хотелось бы узнать, не сможете ли вы отвезти меня в аэропорт?» рассматривать буквально, то оно будет выглядеть многословной цепочкой непоследовательностей. Зачем извещать меня о том, что занимает ваши мысли? Почему вы решили, что это в моей компетенции отвезти вас в аэропорт и при каких предполагаемых обстоятельствах это будет сделано? Конечно, настоящее намерение — «Отвезите меня в аэропорт» — читается легко, но поскольку оно так и не было открыто заявлено, у меня есть путь к отступлению. Никто из нас не живет в таких угрожающих условиях, что отданный кем-то приказ предполагает обязательное повиновение. Намеренные нарушения неписаных норм коммуникации являются поводом к более веселым формам небуквальной речи, таким как ирония, юмор, метафора, сарказм, парирование, уговаривание, риторика, языковое воздействие и поэтичность. Метафора и юмор — это удобные способы обобщить, какие два ментальных процесса принимают участие в понимании предложения. Большинство обиходных выражений, связанных с языком, используют метафору «канала», которая охватывает процессы синтаксического разбора. В рамках этой метафоры понятия — это предметы, предложения — это емкости, а коммуникация — это акт отправки чего-либо. Мы «собираем» понятия, чтобы «заключить» их «в» слова, а если наше высказывание не «пустое» или «полое», то мы можем «донести» эти понятия «до» слушателя, который может «разобрать» их, чтобы вычленить их «содержание». Но, как мы уже убедились, эта метафора наводит на ложный след. Весь процесс понимания лучше характеризует шутка о двух психоаналитиках, которые встретились на улице. Один сказал: «Доброе утро!» Второй подумал: «Интересно, что же он имеет в виду?» Примечания:1 В английской терминологии лингвистика относится к так называемым arts — искусствам. — Прим. перев. 9 Добросовестными (лат.). — Прим. перев. 10 Береговая охрана — морская пограничная служба США двойного подчинения: в мирное время — в ведении министерства финансов, в военное — министерства ВМС — Прим. перев. 94 Название главы совпадает с названием американской вокально-инструментальной группы «Talking Heads», особенно популярной в 1970–1980-х гг. — Прим. ред. 95 СЗРО — робот из кинофильма «Звездные войны». — Прим. перев. 96 Мистер Магу, или Куинси Магу — неловкий и вспыльчивый персонаж серии мультфильмов. — Прим. ред. 97 Грамматические и синтаксические ошибки в речи компьютера присутствуют и в оригинальном тексте. — Прим. перев. 98 Сеть магазинов, специализирующихся на продаже бытовых товаров радиоэлектроники и компьютеров. — Прим. ред. 99 Благодаря наличию в русском языке падежей, «предложения-капусты», какими бы громоздкими они ни были, все же поддаются пониманию. — Прим. перев. 100 Кэрролл Льюис. Алиса в Зазеркалье / Пер. Н. М. Демуровой. М.: Наука, 1991. С. 211. — Прим. перев. 101 Указанное количество существительных является правильным только для английских примеров, количество существительных в синтаксических группах перевода им не соответствует. — Прим. перев. 102 Перевод предполагавшегося толкования — Время летит, как стрела. Иные толкования стали возможны благодаря тому, что в английском слово time является как существительным — ‘время’, так и глаголом — ‘измерять (о времени)’ а форма инфинитива для глагола time совпадает с формой повелительного наклонения. Соответственно time может быть истолковано как ‘измеряйте скорость’. Слово fly может быть как глаголом — ‘летать’, так и существительным — ‘муха’, а форма 3-го лица ед. ч. настоящего времени для глагола (flies ‘летит’) совпадает с формой множественного числа для существительного (flies ‘мухи’). Соответственно time flies может быть истолковано как ‘время летит’ и как ‘измеряйте скорость мух’. Существительное time также может выступать как часть сложных слов (compounds), что и дало time flies ‘мухи времени’. Слово like является одновременно и союзом ‘как’ и глаголом ‘любить’. Соответственно time flies like… может быть истолковано и как ‘мухи времени любят…’. — Прим. перев. 103 Игра слов основана на том, что глагол have — had в английском помимо основного значения ‘иметь’ может обозначать: ‘поедать что-либо’, ‘рожать’, ‘иметь сексуальные отношения’. Соответственно строчка из песенки может быть истолкована как: ‘Мэри съела ягненка’, ‘Мэри родила ягненка’ и ‘Мэри совокупилась с ягненком’. — Прим. перев. 104 Влиятельная ежедневная газета деловых кругов США. — Прим. ред. 105 Первая часть предложения — The woman sitting next to Steven Pinker’s pants… — может направить по ложному следу: ‘Женщина, сидящая рядом с брюками Стивена Пинкера…’ — Прим. перев. 106 Первая часть предложения — Sherlock Holmes didn’t suspect the very beautiful young countess… может направить по ложному следу: ‘Шерлок Холмс не подозревал прекрасную молодую графиню…’ — Прим. перев. 107 Ратифицированная 15 декабря 1791 г. первая поправка к Конституции США гарантировала гражданские свободы. — Прим. ред. 108 В русской лингвистике информация о чем-то уже известном называется темой высказывания, а информация о чем-то новом — ремой. В дальнейшем будут употребляться эти термины. — Прим. перев. |
|
||
Главная | В избранное | Наш E-MAIL | Прислать материал | Нашёл ошибку | Верх |
||||
|