Дар речи – одна из самых удивительных и самых человеческих способностей. Мы настолько привыкли постоянно пользоваться этим чудесным даром природы, что даже не замечаем, насколько он совершенен и загадочен. У человека рождается мысль. Чтобы передать ее другому, он произносит слова. Не удивительно ли, что акустическая волна, рожденная голосом человека, несет в себе все оттенки его мыслей и чувств, достигает слуха другого человека и тотчас же все эти мысли и чувства становятся доступны этому человеку, он постигает их потаенный смысл и значение! Как же это происходит? Какие законы акустики, физиологии, психологии лежат в основе этого обыденного для нас чуда природы?
Чтобы получить ответы только на часть этих вопросов, наука прошла долгий исторический путь, отмеченный вехами крупнейших открытий и многочисленных теорий речевого процесса. Над изучением многогранной проблемы речи сегодня во всем мире работают десятки научных лабораторий и тысячи самых разнообразных специалистов. Однако природа таит здесь еще немало загадок для исследователей. Одна из них – проблема языка эмоций.
Прислушайтесь к звукам речи незнакомого человека… Разве тембр голоса, манера говорить, интонации не расскажут вам многое о его чувствах и характере? Ведь голос бывает теплый и мягкий, грубый и мрачный, испуганный и робкий, ликующий и уверенный, ехидный и вкрадчивый, твердый и торжествующий и еще с тысячью оттенков, выражающих самые разнообразные чувства, настроения человека и даже его мысли.
Говорящий человек передает слушателю информацию двух основных категорий. Во-первых, мы узнаем, ЧТО говорит человек, какие произносит слова. Это смысловая или семантическая информация. Поскольку она выражена словом, то ее называют вербальной (т. е. словесной) или лингвистической (языковой) информацией. Во-вторых, вместе со словом – по тому, как говорит человек, – слушатель получает множество сведений о самом говорящем, его отношении к предмету разговора, к слушателю и даже к самому себе. Все эти виды информации в значительной мере не зависят от того, ЧТО говорит человек (какие слова произносит), и потому обозначаются термином экстралингвистическая (т. е. неязыковая, внеязыковая) или невербальная информация.
Один из важнейших видов экстралингвистической информации – эмоциональная, характеризующая эмоциональное состояние говорящего, его отношение к предмету разговора, к слушателю и т. п.
Как правило, эмоциональный контекст речи созвучен ее логическому смыслу и значительно его усиливает. Но он независим от логического смысла речи, поэтому может даже ему противоречить. При этом в обычной разговорной речи мы склонны больше верить этому эмоциональному контексту, нежели логическому смыслу, например, радушным словам, сказанным с насмешкой или гневно.
Каждое из написанных слов ДА и НЕТ имеет только один смысл, одно значение. Каждое же из этих произнесенных слов может иметь множество различных смыслов и значений, в том числе и таких, которые полностью противоречат их словесному значению или существенно его изменяют.
Отсюда понятно, какое огромное психологическое значение имеет канал экстралингвистической информации для общения людей и понимания их друг другом. Но столь же велика роль этого канала, как мы увидим, и для общения человека с ЭВМ (см. ниже).
Эмоциональная информация не единственная в системе невербальной звуковой коммуникации человека. Согласно разработанной нами классификации (Восприятие речи…, 1988), в голосе человека можно выделить до семи видов невербальной экстралингвистической информации: 1) эстетическая – например, голос приятный, неприятный, красивый, некрасивый, резкий по высоте и тембру (бас, баритон, тенор), что важно в искусстве, и т. п.; 2) эмоциональная – предмет нашего разговора; 3) индивидуально-личностная – позволяющая опознать личность говорящего по его голосу; 4) биосоциальная – пол, возраст, национальность – по акценту и др.; 5) психологическая – черты характера, воля, темперамент, самооценка, оценка слушателя и т. п.; 6) медицинская, свидетельствующая о состоянии здоровья, – например, простуженный голос и т. п.; 7) пространственная, указывающая месторасположение и перемещение говорящего в пространстве по отношению к слушателю (впереди, сбоку, сзади, далеко, близко, приближается, удаляется и т. п.).
Конечно, нельзя думать, что указанные виды невербальной информации существуют в голосе человека как нечто изолированное друг от друга и легко разделимое. Дело обстоит значительно сложнее. Все эти составляющие невербального аккомпанемента слову находятся в сложнейшем взаимодействии друг с другом, с одной стороны, и со словом – с другой, имеют разную степень выраженности и значимости для слушателя и вместе с тем воспринимаются им как единый образ говорящего и смысл передаваемой им информации.
В обыденной жизни, да и в науке, мы еще не осознали полностью того огромного значения, которое имеет для нас этот органически сплавленный со словом эмоционально-образный аккомпанемент. В рассказе чешского писателя К. Чапека «Дирижер Калина» есть такой любопытный эпизод. Человек оказывается по воле судьбы в чужой стране и, не зная языка этой страны, тем не менее понимает случайно подслушанный разговор двух людей: «Слушая этот ночной разговор, я был совершенно убежден, что контрабас склонял кларнет к чему-то преступному. Я знал, что кларнет вернется домой и безвольно сделает все, что велел бас. Я все это слышал, а слышать – это больше, чем понимать слова. Я знал, что готовится преступление, и даже знал какое. Это было понятно из того, что слышалось в обоих голосах, это было в их тембре, в кадансе, в ритме, в паузах, в цезурах… Музыка – точная вещь, точнее речи!».
Здесь автором подчеркивается особая способность именно музыканта дирижера Калины с его тонким, музыкальным слухом воспринять и понять, что хотели сказать друг другу люди. Это, несомненно, так, но предметно-образным эмоциональным слухом, который в данном случае оказал услугу Калине, обладают не только музыканты, но и все люди, правда, в существенно разной степени.
До недавнего времени исследователей интересовали лишь законы вербальной речи, т. е. слово. Эмоционально-выразительные же свойства речи, как и другие ее невербальные особенности, как-то оставались в тени. Именно лингвисты назвали их внеязыковыми – экстралингвистическими и даже, как пишет профессор Л. В. Бондарко, рассматривали их «как нечто негативное, затрудняющее языковое общение». Однако в последние годы именно эти экстралингвистические свойства речи, в частности эмоциональные, так «досадно нарушающие» законы фонетики, и вызывают всевозрастающий интерес специалистов, в том числе и самих фонетистов.
Причины интереса специалистов к языку эмоций и ко всем другим видам экстралингвистической информации речи (индивидуально-личностным, возрастным, половым различиям и др.) заключаются в том, что свойства эти, так нормально и естественно воспринимаемые нашим мозгом и даже помогающие, как дирижеру Калине, понять смысл разговора, сильнейшим образом затрудняют решение проблемы автоматического распознавания речи, т. е. понимания нашей естественной звуковой речи компьютером. Поэтому сегодня не только лингвисты и физиологи, но и инженеры-конструкторы ЭВМ хотят знать, как же мозг человека справляется с этой грандиозной задачей – выделением нужной информации из сложнейшего и столь причудливо и притом мгновенно изменяющегося во времени звукового потока, именуемого звуковой речью. Специалисты считают, что только такой бионический подход позволит решить проблему дальнейшего усовершенствования систем автоматического распознавания речи.
Обратимся же и мы к более подробному рассмотрению эмоциональных и некоторых других компонентов системы звуковой экстралингвистической коммуникации человека, которая была предметом наших исследований в течение многих лет. Рассмотрение это договоримся провести в аспекте следующих основных свойств и особенностей невербальной экстралингвистической коммуникации, отличающей ее от собственно речевой вербальной системы:
1) значительно большей эволюционной древности, по сравнению со словом;
2) ее психофизиологической обособленности и независимости от слова, непроизвольности и в значительной мере подсознательности;
3) всеобщей универсальности, понятности и независимости от языковых барьеров между людьми;
4) особой обеспеченности акустическими средствами кодирования и физиологическими механизмами декодирования;
5) особой роли в решении проблемы диалога «Человек – ЭВМ».
Страстный оратор, певец или музыкант, который разнообразными звуками или модуляциями голоса возбуждает самые сильные эмоции в своих слушателях, едва ли подозревает, что пользуется теми же средствами, которыми в очень отдаленной древности его получеловеческие предки возбуждали друг у друга пламенные страсти во время ухаживания и соперничества.
Способность человека выражать голосом эмоции считается исторически более древней по сравнению со словесной речью. По-видимому, языком эмоций наши далекие предки владели задолго до того, как научились вербальной речи. Существует ряд доказательств такого мнения. Любопытно, что одно из них – это сам современный говорящий человек, точнее особенности развития его речи в детском возрасте. Что касается голоса, то человек владеет им с момента рождения, а вот речь, как известно, появляется значительно позже – к полутора, а то и к двум годам.
Однако задолго до овладения речью ребенок уже прекрасно владеет способностью общаться с окружающими на языке эмоций. Радость, печаль, горе, гнев, страх – эти чувства в его голосе различит не только чуткое ухо матери, но и слух любого человека. В младенческом возрасте человек выражает не только собственные эмоции. Он прекрасно понимает эмоциональную интонацию взрослых, даже еще в тот период, когда он не понимает логического смысла слов. Например, он улыбается в ответ на ласковые слова и может заплакать в ответ на суровые. Но, может быть, он все-таки понимает слова? Простой эксперимент дает нам ответ.
Попробуйте произнести ребенку до полугодовалого возраста самые грозные и злые слова, но добрым, ласковым голосом, и он будет улыбаться. И наоборот, в ответ на нежные, ласковые слова, произнесенные злым голосом, ребенок испугается и может заплакать. Ясно, что реагирует он именно на эмоциональную окраску голоса. В этом отношении дети реагируют на эмоции, подобно высшим животным: собака, например, реагирует на интонацию голоса аналогичным образом. Автор этих строк как-то записал на магнитофон смех и плач своего восьмимесячного сына. Стоило теперь воспроизвести малышу его же собственные звуки, как он тут же впадал в соответствующее эмоциональное состояние: смеялся, слыша свой смех, или плакал, слыша свой плач. Это явление часто наблюдается в родильных домах и яслях.
Таким образом, дети в раннем возрасте, еще не зная речи, владеют языком эмоций, общаются со взрослыми на этом языке и отлично понимают друг друга. Период этот наука рассматривает как отражение определенной стадии эволюции человека, предшествующей появлению у древних людей логической речи.
По мнению американского ученого Уайна Ли, использование общих принципов и закономерностей овладения ребенком речью в процессе онтогенеза является весьма перспективным путем и для обучения компьютера более совершенным способам автоматического распознавания и синтеза речи. Можно добавить, что столь же полезными могут оказаться в этом плане данные науки о развитии речи человека в филогенезе, т. е. в процессе ее длительного исторического развития (эволюции).
Когда говорят о речи, то обычно подразумевают слово, т. е. вторую сигнальную систему – речевую. При помощи слова человек может выразить не только любую мысль, логическое понятие, но и чувство, эмоцию. Для этого существуют такие слова, как «радость», «горе», «гнев», «страх», и тысячи других. Картины сложных эмоциональных переживаний, рисуемые писателями в литературных произведениях, – это словесный, или, как говорят в науке, вербальный, способ выражения эмоций.
Но любую эмоцию человек может выразить, как известно, и непременно выражает еще и особыми красками и интонациями своего голоса.
Существует пластинка Стэна Фреберга, которая называется «Джон и Марсия». Все ее содержание состоит из повторения этих слов: мужской голос повторяет имя «Марсия», женский – «Джон». Однако благодаря тому, что эмоциональная интонация произношения меняется от слова к слову, содержание пластинки, основу которого составляет любовная история, всем слушателям становится предельно ясным.
Язык эмоций как совершенно самостоятельный канал передачи информации может функционировать не только параллельно со словом, определяя эмоциональный контекст сказанного, но может «работать» и без всякого слова, например в форме различных возгласов, хмыканий, оханий, плача, смеха и т. п.
Среди множества теорий возникновения речи есть и такие, которые говорят о ее происхождении именно из этих эмоциональных возгласов, поначалу спонтанно вырывавшихся у древних предков человека в процессе различных видов их жизнедеятельности (Линден, 1981).
Одним из древнейших средств обмена информацией, по-видимому, следует считать жест, предшествовавший, по мнению ряда специалистов, возникновению звуковой речи (Морозов, 1987). Обилие жестикуляций у приматов хорошо подтверждает эту теорию.
Любопытно, что эмоциональную интонацию С. М. Эйзенштейн называл звуковым жестом, подчеркивая тем самым родство этих двух средств выразительности. Действительно, трудно себе представить человека, о чем-то эмоционально говорящего, например спорящего, и при этом не сопровождающего свою речь соответствующими жестами, мимикой, позами. Жест – это органический компонент языка эмоций, связанный с ним единой сущностью – эмоциональным состоянием организма. Искусство пантомимы прекрасно иллюстрирует, как велики возможности языка жестов как канала передачи информации. Важно отметить, что жест может нести не только эмоциональную, но и семантическую информацию. Так, южноафриканские охотники-бушмены используют систему жестов-знаков для обозначения различных животных, новогвинейское племя сибиллер – систему жестов для обозначения счета от 1 до 27 и т. п.
Жест – эта древнейшая форма передачи информации – миллионы лет служит человеку и его предкам. С одной стороны, он имеет эквивалент в мире животных в виде языка поз и телодвижений, а с другой – является важнейшим информационно значимым аккомпанементом речевого общения и современного человека как в жизни, так и в искусстве (речь, пение, ораторское искусство).
Несомненно, что именно коллективные, общественные формы этой жизнедеятельности (охота, труд), обусловливавшие повышенную потребность древних людей в обмене информацией, и привели, по мысли Ф. Энгельса, к возникновению речи.
Рис. 1. К проблеме эволюции языка эмоций (см. эпиграф к статье)
Конкретным толчком к появлению слова, согласно некоторым теориям, могло послужить звукоподражание, т. е. обозначение древними людьми предметов и явлений внешнего мира путем имитации голосом (звуком), опять-таки эмоционально-образно характеризующих этот предмет или явление (Линден, 1981). Поэтому нетрудно усмотреть сходство этой теории с теорией эмоциональных возгласов. Подобный способ словообразования наблюдаем мы у ребенка на ранних стадиях обучения его речи. Он говорит «гав-гав» вместо «собачка», «ту-ту» вместо «машина», «топ-топ» вместо «ходить» и т. п.
Эти эмоционально-образные голосовые звуки и интонации, которыми так богато насыщена речь ребенка и которые не исчезают в речи взрослого, придавая его словам особый, подчас совсем иной смысл, и есть тот древний язык эмоций, который у наших далеких предков был, по Ч. Дарвину, единственным средством общения и взаимопонимания. В свете эволюционной теории (онтогенез повторяет филогенез) процесс овладения речью нашими древними предками шел по такому же пути: от эмоционально-образного описания предметов и явлений внешнего и внутреннего мира голосовыми звуками, характеризующими эти явления (иконическая знаковая форма), к абстрактному слову-символу, непосредственно не связанному с описываемым явлением (символическая знаковая форма).
На каком этапе своей эволюции человек перешел от языка эмоций к слову-символу, сказать трудно, но ясно, что процесс этот эволюционизировал долго. Согласно современным представлениям (по данным авторитетного американского антрополога Б. Кэмпбелла из Калифорнийского университета), превращение человекообразного существа австралопитека в человека произошло около 1,3 млн лет назад, хотя процесс этот начался 3 млн лет назад.
Тем не менее попытки уяснить как и когда продолжаются. Ученые, например, решили определить, как говорили наши далекие предки, каковы были звуки их голоса. Анатом Эдмунд Крелин из Йельского университета на основе окаменелых остатков костей древнего человека реконструировал строение его голосового аппарата. Оказалось, гортань у древнего человека была расположена очень высоко, а глотка малоразвита. По строению речевого аппарата он более походил на новорожденного ребенка или шимпанзе (Иди М. Возникновение человека. Недостающее звено. М.: Мир, 1977).
Далее на помощь была призвана современная техника. Специалист по речи Филипп Либерман из Коннектикутского университета измерил резонансные полости речевого аппарата реконструированной модели, заложил эти данные в ЭВМ и получил характеристики речи древнего человека. Оказалось, что он плохо мог артикулировать звуки А, И, У и темп его речи был очень медленным. Современный человек способен произносить до 30 фонетических элементов в секунду, а древний – в 10 раз меньше, т. е. говорил он, по нашим понятиям, неестественно, растягивая звуки, как бы пропевая их.
Что же, эта версия вполне соответствует неоднократно высказываемым в литературе мнениям, что древний человек раньше научился петь, чем говорить (Ч. Дарвин, О. Джесперсен, С. Л. Рубинштейн).
Рис. 2. К проблеме эволюции и онтогенеза голосового аппарата человека (по: Блум, Лейзерсон, Хофстедтер, 1998)
Как мы видим, язык эмоций за миллионы лет своего существования проделал удивительную эволюцию. Истоки его мы находим в звуках животных (Ч. Дарвин, Л. А. Фирсов, Г. В. Гершуни). Миллионы лет он служил единственным средством общения у наших древних предков. С возникновением абстрактно-логической словесной речи и второй сигнальной системы как эволюционно более прогрессивной формы общения и мышления он, однако, не умер. Для современных людей язык эмоций составляет важнейший канал обмена информацией в процессе их повседневного жизненного общения. Более того, в искусстве сценической речи и пения этот древний язык, разумеется, определенным образом видоизменившись в соответствии с требованиями этих видов искусства, вновь приобрел главенствующее положение. Ибо отнимите у любого искусства его эмоциональную выразительность, и оно перестанет быть искусством.
Всеобщая понятность и универсальность языка эмоций у всех народов мира в их речи в искусстве, распространяющиеся даже на мир животных, основаны, как нами показано (Морозов, 1977а), на закономерных связях между акустическими средствами выражения эмоций голосом и физиологическим состоянием организма, испытывающего ту или иную эмоцию.
Такова любопытная судьба языка эмоций на протяжении миллионов лет его существования. Но изучение его не закончено – оно только начинается.
Характерная черта языка эмоций – его независимость от слова. Эмоциональная интонация может усиливать смысл слова, противоречить ему и существовать вообще без слов. Чем же объяснить столь независимое функционирование этих двух каналов передачи информации – словесного и эмоционально-образного?
Причина найдена в особых свойствах нашего мозга. Как известно, он состоит из двух половин – правой и левой, казалось бы совершенно симметричных. Исследования, однако, показали, что половины эти наделены природой разными функциями. Левое полушарие мозга, называемое собственно речевым или доминантным полушарием, ответственно за способность человека как логически, связно говорить (зона Брока), так и правильно воспринимать логику слов (зона Вернике). Нарушения этих мозговых зон (травма, опухоль и т. п.) приводят к утрате человеком соответствующих способностей связно, логически говорить и понимать логику речи.
В правой половине мозга расположены зоны, ответственные как за формирование эмоционально-образных свойств речи, так и за восприятие их в голосе другого человека. Считается, что своими музыкальными способностями человек обязан развитию соответствующих зон правой половины мозга. Нарушения их приводят к амузии, т. е. неспособности понимать музыку и эмоционально-образную интонацию речи.
Более широкие исследования показали, что левая половина мозга ответственна не только за логику речи, но и вообще за все формы абстрактного логического мышления и представления внешнего и внутреннего мира человека. Это рациональный мозг, оперирующий логикой, знаками, символами и абстракциями.
Правая половина – это эмоциональный мозг, воспринимающий все явления внешнего и внутреннего мира в конкретной, образной и, если угодно, художественной форме.
Между полушариями мозга имеется толстый «телефонный кабель» из миллионов нервных волокон, по которому обе половины мозга обмениваются информацией по любому поводу. Вот почему все предметы и явления внешнего мира человек воспринимает целостно: образно-эмоционально и в то же время логически. Правда, у разных людей преобладает либо образно-эмоциональная, либо рационально-логическая форма мышления и восприятия мира (художественный и мыслительный типы, по И. П. Павлову), что, по-видимому, связано с преобладанием функций либо правого, либо левого полушария мозга.
Ошибкой было бы думать, что у больших художников, писателей, артистов, композиторов плохо развита абстрактно-логическая функция мозга. Скорее, наоборот, большой художник – всегда и большой мыслитель. Художественное творчество в любом виде искусства только тогда достигает совершенства, когда поднимается до уровня социального и даже философского осмысливания и обобщения действительности. Именно потому настоящее, большое искусство не только доставляет эмоционально-эстетическое наслаждение, но и заставляет задуматься, страдать, негодовать, стремиться к совершенству и достижению истины.
Точно так же ошибкой было бы думать, что творчество ученого в его наилучшем виде – это максимальная активность рационально-логических свойств мозга при полной пассивности его эмоционально-образной функции. Такая модель характерна для робота или случаев патологии в деятельности мозга.
Для гармонического развития человека обе функции его мозга – абстрактно-логическая и эмоционально-образная – должны быть пропорционально «нагружены». Особенно сильно страдают мозг и здоровье человека от перегрузки абстрактно-логической функции, особенно в детском возрасте. Перегруженные школьные программы предусматривают введение информации в детский мозг главным образом через абстрактно-логическую половину мозга. А ведь в детском, особенно раннем, возрасте эта функция, еще совсем не сформировавшаяся и маломощная, не обеспечивает большую пропускную способность информации и к тому же особенно хрупка и ранима. Безусловно, ее нужно развивать, но столь же безусловно, что перегрузка ее недопустима. Имеются работы, доказывающие происхождение по этой причине многих болезней и расстройств детского организма. Это нам особенно необходимо учитывать и использовать в развернувшемся сегодня движении по реформации школьных программ.
Научное изучение языка эмоций предполагает, что мы имеем в своем распоряжении определенный набор образцов этого языка, очевидно, в форме эмоционально окрашенных речевых фраз и голоса человека. Существуют разные способы получения такого рода исходного материала для исследования: магнитофонная запись речи в экстремальных ситуациях, например при испытаниях техники на полигонах, в условиях спортивных состязаний, внушение человеку определенных эмоциональных состояний под гипнозом.
В нашей работе использовался так называемый метод актерского моделирования, точнее выражения эмоций, основанный на способности актера перевоплощаться в разные эмоциональные состояния, как бы моделировать их своим поведением и голосом.
Эмоциональные краски своего голоса талантливый актер, конечно же, не выдумывает, а берет из жизни. И чем талантливее актер, тем более естественны и жизненно правдивы эти краски. В литературе существуют обоснования возможности использования метода актерского моделирования эмоций для научных целей.
Голос Ф. И. Шаляпина является признанным во всем мире образцом эмоционально-художественной выразительности. О Шаляпине написано много. Вместе с тем в литературе нам не удалось встретить ни одной работы, посвященной анализу акустических средств эмоциональной выразительности его голоса. Поэтому мы и решили восполнить этот недостаток. Из репертуара Шаляпина (в грамзаписи) было отобрано и выделено несколько десятков фраз, эмоциональный смысл которых был достаточно однозначно истолкован группой компетентных экспертов. Ряд фраз был подвергнут дополнительной оценке детьми младшего возраста (1 класс), незнакомыми с данными произведениями Шаляпина. Опыты показали, что дети, так же как и взрослые, адекватно истолковывают эмоциональный смысл этих фраз.
Рис. 3. Шаляпин прекрасно передает голосом и неподражаемым сценическим поведением всю гамму эмоций: страх Бориса, радость подгулявшего Еремки, гнев старого Мельника
Проведенный акустический анализ показывает, что интегральные спектры эмоционально окрашенных фраз в исполнении Шаляпина существенно различаются (см. ниже рисунок 5). Но, может быть, эти различия в слуховом восприятии разных фраз вызваны тем, что Шаляпин поет разные слова? Не подсказывает ли нам сам текст фраз характер его эмоциональной окраски?
Чтобы исключить эти подозрения, мы прибегли к помощи современных вокалистов и актеров, которых просили пропеть или произнести одну и ту же фразу, но с различными эмоциональными оттенками. Точность выполнения этой задачи певцами и артистами решалась группой слушателей-экспертов из числа компетентных специалистов. Результаты представляются в баллах (по 100-балльной системе) как среднее по способности выражать эмоции радости, горя, гнева, страха.
Особую ценность в наших исследованиях приобрели записи эмоционально окрашенных фраз, произнесенных народным артистом СССР Олегом Басилашвили. Из этих записей в основном и были сформированы эталонные программы, служившие для исследования языка эмоций и, в частности, эмоционального слуха человека.
При оценке способности актеров выражать голосом эмоции (моделировать эмоциональные состояния) мы обнаружили, что не только актеры и вокалисты обладают этой способностью в разной степени совершенства, но и слушатели тоже, оказывается, по-разному слышат эмоциональные краски голоса говорящего или тем более поющего человека.
Слух человека как способность его к восприятию звуковых колебаний имеет много разновидностей. Так, например, существует речевой, или фонематический, слух как способность к восприятию и пониманию звуков речи. Выделяют тонкий тональный слух (слух настройщика), известен всем музыкальный слух у виртуозов-исполнителей. Он, в свою очередь, имеет разновидности: абсолютный, относительный, тембровый, мелодический и т. п. Вместе с тем певцы обладают вокальным слухом, который не сводится к музыкальному, ибо есть прекрасные музыканты, не имеющие вокального слуха.
Наконец, мы впервые привели термин эмоциональный слух, обозначающий явление совершенно особого рода. Ясно, что эмоциональный слух – это не то что речевой, так как есть люди, плохо слышащие эмоциональную интонацию, эмоционально тугоухие. И наоборот, утонченный эмоциональный слух нередко сочетается со скромными речевыми способностями. В более близком родстве эмоциональный слух состоит с музыкальным слухом: у музыкантов и певцов эмоциональный слух хорошо развит, но тем не менее по-разному. Бывают музыканты с безукоризненной, математически точной музыкальностью, которым, однако, не хватает эмоциональности. Это «формальные музыканты», которым трудно найти дорогу к сердцу слушателя.
Мы обнаружили, что варьируют не только способности людей выражать эмоции голосом, но и способности слушателей правильно воспринимать.
В науке существует понятие художественного типа личности. Еще известный физиолог академик И. П. Павлов предложил делить людей по их психологическому складу на два типа: мыслительный и художественный. К сожалению, И. П. Павлов не оставил методов, позволяющих определить, к какому типу принадлежит тот или иной человек. В настоящее время такие методы разрабатываются в Институте психологии Академии наук совместно с практиками вокально-музыкального искусства. Одним из основных показателей художественного типа личности, как считают не только исследователи, но и многие практики искусства, и является развитость эмоциональной сферы человека, проявляющаяся, по нашим данным, в степени тонкости эмоционального слуха.
Как же оценивается степень развитости эмоционального слуха у человека? Для этого и применяются уже известные читателю тесты, состоящие из набора эмоционально окрашенных речевых (в частности, полученных с участием О. Басилашвили) и вокальных (т. е. пропетых певцами) фраз (в форме магнитозаписей). Прослушав звучание эмоционально окрашенных фраз, в ряде которых содержится лишь слабый намек на радость, горе, недовольство, страх или вообще не содержится никакой эмоции, каждый из слушателей должен записать свои суждения о характере эмоциональной интонации голоса артиста в определенные графы специальных бланков. Степень правильности этих записей в дальнейшем выражается в процентах правильных оценок слушателем всех фраз и выражается по 100-балльной шкале (легко трансформируемой в 5- или 10-балльную шкалу).
Как показывают массовые исследования эмоционального слуха, проведенные нами, степень его развитости у людей разных возрастных и профессиональных категорий проявляется в весьма широких пределах – от 20–30 до 95–98 условных единиц (по 100-балльной шкале). Исследователи склоняются к мнению, что тонкий эмоциональный слух – это в значительной мере природное качество человека, свойственное людям художественного склада личности. Вместе с тем эмоциональный слух можно и развить путем целенаправленных упражнений.
Совершенно очевидно, что эмоциональный слух, как показатель художественной одаренности человека, важен, прежде всего, для лиц художественных профессий (актеров, вокалистов и др.). Именно поэтому тесты на степень развитости эмоционального слуха и были применены нами неоднократно, в частности при обследовании молодых актеров и вокалистов, поступающих в театральные вузы и консерватории (Ленинградский институт театра, музыки и кинематографии, Московская госконсерватория и др.). Исследования эти в настоящее время нами продолжаются с целью сопоставления критерия эмоционального слуха с другими психологическими показателями эмоциональности и художественности натуры человека. Как показали наблюдения, обладатели тонко развитого эмоционального слуха достигают больших успехов в обучении.
Но эмоциональный слух нужен не только в искусстве. Сегодня существуют такие виды важных работ, выполнение которых в значительной степени зависит от общего и эмоционального состояния человека (например, космонавтов, летчиков-испытателей и т. п.). Поскольку единственным каналом связи, например, с космонавтами часто является речевой канал, судить об их эмоциональном состоянии приходится только по голосу. Но, как мы уже знаем, воспринять тонкие эмоциональные изменения в голосе говорящего способен не каждый человек. По нашим данным, на 100 человек населения приходится лишь 2–3 человека, обладающих особо тонким эмоциональным слухом. Они дают 95–98 % правильных ответов там, где средний человек не ошибается только в 70 % случаев. Разработанные нами тесты и процедуры позволяют выявить таких людей, которым можно доверить контроль за эмоциональным состоянием человека в особо ответственных случаях.
Эмоциональная восприимчивость и отзывчивость представляют собой далеко не узкоспециальный интерес для людей художественных профессий. Эмоции – это в полном смысле характеристика любого человека, его характера и свойств личности. Вспомним в этой связи «Венецианского купца» Шекспира:
Тот, у кого нет музыки в душе,
Кого не тронут сладкие созвучья,
Способен на грабеж, измену, хитрость;
Темны, как ночь, души его движенья –
И чувства все угрюмы, как Эреб:
Не верь такому – слушай эту песню!
Нормальные человеческие эмоции – далеко не бесполезное свойство человека, а одно из необходимых условий полноценного развития нашей духовной жизни и творческих способностей в любом деле.
Для передачи смысла речи человек пользуется определенным способом кодирования информации, т. е. всем известным алфавитом. Из элементов этого алфавита – фонем – и составляются слова и фразы связной речи, несущие определенный смысл. Возникает вопрос: существует ли подобный алфавит для языка эмоций? Вопрос этот в последние годы задавали себе многие специалисты. Мы пытались решить его на примере изучения актерской и вокальной речи или пения, которые, как уже упоминалось, особенно насыщены эмоциями и поэтому представляют удобный объект для такого рода исследований.
Задача ставилась так: если наш слух способен обнаружить в голосе человека определенную эмоциональную окраску, например эмоции горя, радости, гнева и т. п., то, очевидно, должны существовать какие-то объективные акустические признаки, которые ответственны за передачу этих эмоций слушателям. Что же это за признаки и какие акустические свойства звука их несут: громкость ли голоса, высота, тембр и т. п.? С помощью метода экспертных оценок (а экспертами служили люди самых разных профессий и возрастов) было отобрано несколько десятков фраз из различных вокальных произведений (в исполнении Ф. Шаляпина и других певцов), насыщенных совершенно определенным эмоциональным смыслом (радость, горе, гнев, страх).
Изучение акустической структуры этих фраз показало, что она существенно различается в зависимости от того, какую эмоцию певец выражает. Особенно это хорошо выявилось в тех случаях, когда певца (имеются в виду современные профессиональные вокалисты) экспериментаторы просили одну и ту же вокальную фразу пропеть несколько раз, причем каждый раз с разным эмоциональным оттенком. Опытные певцы прекрасно справляются с этой задачей, а некоторые даже оказались способными любую эмоцию выразить при пении мелодий без слов, так называемых вокализов, и даже лишь одной гласной на одной ноте. Поскольку в этих опытах фонетический состав фраз постоянен, все изменения акустической структуры фразы можно было отнести за счет изменения ее эмоционального смысла (рисунок 4).
Рис. 4. Вероятность правильного восприятия слушателями разных эмоций (вокальная речь, скрипка).
Язык эмоций независим от смысла слова. Одним из доказательств этого положения является способность человека – актера, певца, музыканта – выразить эмоции не только при произнесении (или пении) фразы со словами, но вокализации ее без слов (вокализ на мелодию фразы «Спи, дитя мое»), при пении одной гласной на одной ноте и даже при помощи звука скрипки. В последнем случае скрипачу давалось задание выразить радость, гнев, страх и т. д. при игре отрывка из «Рондо каприччиозо» Сен-Санса. По вертикальной шкале – вероятность правильного восприятия слушателями разных эмоций (%)
Сложная электроакустическая обработка (с применением ЭВМ) полученных таким методом образцов голоса, насыщенного разными эмоциями, показала, что каждая из перечисленных эмоций – радость, горе, гнев, страх – выражается изменением не какого-либо одного свойства звука, а практически всех его свойств: силы, высоты, тембра, темпо-ритмических характеристик. Изменения эти касались даже и тех характеристик вокальной фразы, которые были заданы композитором, т. е. звуковысотного и темпо-ритмического рисунков мелодии. Таким образом, выражая ту или иную эмоцию, певец в той или иной степени отклоняется от предписаний нотной записи, что и определяет эмоциональную окраску его голоса.
Причем оказалось, что для каждой эмоции характерен свой набор отличительных акустических признаков голоса. Так, для горя – наибольшая длительность слога, медленное нарастание и спад силы звука, характерные «подъезды» и «съезды» в высоте звуков нот, создающие плачущую интонацию, и др. Гнев, наоборот, характеризуется резкими, «рублеными» фронтами и обрывками звука, большой силой голоса, зловещим звенящим или шипящим тембром. Для страха отличительными оказались резкие перепады силы голоса, сильное нарушение ритма мелодии, резкое увеличение пауз и т. п.
Каждый исполнитель, разумеется, пользовался для выражения эмоций своими индивидуальными голосовыми средствами, имел какие-то особенности в варьировании этих средств, например, использовал не все признаки, а только часть их, однако никто из них не избрал, например, для выражения эмоции горя признаки, характерные для радости или гнева, и т. п.
Статистическая обработка акустических признаков разных эмоций подтвердила, что они достаточно надежно друг от друга отличаются, иначе говоря, четко привязаны к своему эмоциональному состоянию. Это и дает основание считать выделенные объективные признаки или акустические средства эмоциональной выразительности голоса певца элементами алфавита языка эмоций в пении (Морозов, 1977а). Но только ли в пении?
Сам термин «язык эмоций» мы до недавнего времени употребляли, скорее, в образном, чем в точном научном смысле. Теперь у нас начинают появляться определенные объективные свидетельства того, что это коммуникационная система, аналогичная в известной мере фонетической системе логической речи. Но вместе с тем несравненно более универсальная, претендующая на всеобщую понятность.
Акустические средства выражения эмоций голосом поражают нас бесконечным разнообразием красок, оттенков и индивидуальных особенностей. Вместе с тем это, казалось бы, необозримое множество звуковых красок подчиняется каким-то внутренним закономерностям. Вначале нас несколько удивило и озадачило, что основные акустические средства выражения эмоций в голосе современных певцов оказались, в сущности, такими же, как и у Шаляпина, несмотря на все своеобразие и индивидуальность разных голосов. Но потом стало ясно: если существует язык эмоций, то иначе и быть не может. Ведь бесконечное разнообразие речевых особенностей людей не мешает существованию единого для всех (разумеется, в пределах данного языка) фонетического алфавита. Точно так же, по-видимому, существует и единый для всех людей акустический алфавит эмоций. Из обрети Шаляпин или любой другой певец какой-нибудь иной, свой алфавит языка эмоций – и его исполнение осталось бы непонятным для слушателей, сидящих в зале. Ведь общение при помощи языка предполагает знание этого языка как говорящим, так и слушающим.
Наши коллеги – В. И. Галунов, В. Манеров и др. – изучали акустические средства эмоциональной выразительности обычной речи. Сопоставление результатов наших исследований показало, что говорящий человек и поющий пользуются, в сущности, общими средствами выражения эмоций, так сказать общим алфавитом, несмотря на существенные различия между речью и пением. Надо думать, что общность эта распространяется и на актерскую речь: голосовые краски для выражения эмоций талантливый актер и певец отбирают из жизни, т. е. из речи. Именно поэтому они отличаются правдивостью и всеобщей понятностью.
Как же родился язык эмоций и на чем основана его универсальность?
Психофизиологическим основанием такой универсальности и всеобщей понятности языка эмоций, по-видимому, является зависимость характера издаваемого человеком звука от физиологического состояния его организма, испытывающего ту или иную эмоцию, в частности от состояния органов голосообразования. Так, например, у человека, находящегося в гневе, вся мышечная система, в том числе и голосовые связки, и дыхательный аппарат, сильно напряжена, что неизбежно и отражается на характере звука. Общее мышечное расслабление человека, «убитого горем», также приводит к характерным изменениям голоса. При выражении радости чувствуется, что человек говорит или поет, как бы улыбаясь чему-то. И действительно, на лице его светится улыбка, влияющая на физиологические свойства звука. Акустическая теория говорит, что расширение ротового отверстия приводит к смещению формантных частот[2] в более высокочастотную область, что и наблюдается при разговоре или пении «на улыбке» (см. спектры голоса Шаляпина на рисунке 5).
Рис. 5. Интегральные спектры голоса Ф. Шаляпина при исполнении им отрывков из вокальных произведений, насыщенных различным эмоциональным содержанием, показывают большие различия в уровне и частотном положении высоких обертонов голоса при выражении радости – 1, горя – 2, гнева – 3, страха – 4. Эти различия и обусловливают характерные изменения тембра голоса артиста при выражении эмоций
Таким образом, акустический признак эмоций в голосе оказывается связан, точнее продиктован, физиологическим признаком состояния. Это лежит в основе не только единства голосовых средств выражения эмоций, но, по-видимому, и в основе восприятия эмоций слушателем. Слушая эмоционально окрашенный звук голоса, мы как бы мысленно представляем себе, каким способом он может быть рожден. Этот процесс, быстрый и подсознательный, укрепленный в нас миллионами лет эволюции, по-видимому, и обеспечивает нам понимание языка эмоций (рисунок 4). Сходный механизм известен в науке как термин «анализ через синтез». Он также нашел отражение в так называемой моторной теории восприятия речи.
Суть «моторной теории» в том, что человек, слушая речь собеседника, как бы мысленно повторяет его слова. Это доказывается микродвижениями, нередко явно выраженных и заметных со стороны, его губ, языка и всех артикулярных органов.
Характерная черта языка эмоций – непроизвольность и подсознательность – проявляется как при его восприятии и декодировании, так и при формировании эмоциональных красок голоса (не потому ли звук голоса нередко выдает, что человек говорит не то, что думает). Попробуйте воспроизвести интонацию своего же собственного эмоционального возгласа, и если вы не актер, то убедитесь в абсолютной фальшивости копии. Недаром теория актерского мастерства, разработанная К. С. Станиславским и нашедшая физиологическое обоснование в трудах П. В. Симонова, требует непременного участия и элементов подсознания в управлении речевой интонацией, равно как и всем поведением актера на сцене.
В свете приведенных данных универсальность языка эмоций основана на сходстве у всех людей – будь то простой человек, артист или моряк – основных физиологических процессов, сопровождающих эмоции. Эти соображения указывают и на известную общность голосовых средств выражения эмоций у людей и высших животных, на что, как уже говорилось, впервые обратил внимание еще Ч. Дарвин в своем трактате «Выражение эмоций у человека и животных».
Наконец, у нас есть основание считать, что средства музыкальной выразительности, точнее эмоциональности, инструментальной музыки также в значительной мере имеют общую природу со средствами эмоциональной выразительности речи и пения. Подтверждение такой точки зрения, кстати сказать, находим мы в высказываниях многих выдающихся деятелей музыкального искусства и в самом их творчестве (Асафьев, Мусоргский, Даргомыжский и др.).
Недаром поэтому язык музыки и пения – понятный всем на земле язык эмоций – звучит на всех международных фестивалях как язык, не знающий границ, содействуя взаимопониманию и дружбе между людьми.
Знакомьтесь. Перед вами улыбающаяся миловидная девушка, обладательница уникальной способности: она владеет «наоборотным языком». Его суть в том, что слова любой фразы Лада может произносить наоборот, т. е. как бы читать их, начиная с последней буквы к первой. При этом делает она это столь быстро и уверенно, что подвергает окружающих просто в изумление. Эти «наоборотные» процедуры Лада легко производит не только со знакомыми словами, но и с незнакомыми, которые она слышит впервые.
Мы пригласили Ладу Самсонову в нашу лабораторию невербальной коммуникации Института психологии Академии наук СССР, чтобы познакомиться более подробно с ее необычными способностями, тем более что в течение ряда лет, точнее с 1987 г., мы занимаемся изучением способностей людей воспринимать смысл слов и значение различных видов невербальной экстралингвистической информации (эмоциональной, индивидуально-личностной и др.) в условиях ее обратного, т. е. инвертированного во времени, предъявления слушателю. Практически это достигается путем прокручивания магнитофонной ленты с записью речевых и других звуков в обратном направлении.
Еще в 60-х годах французский исследователь А. Моль показал, что метод временного инвертирования (т. е. прокручивания магнитоленты в обратном направлении) разрушает для слушателя семантическую, т. е. собственно речевую, вербальную, информацию, но сохраняет, как он пишет, эстетическую информацию, к которой он, по сути его высказываний, причислял все виды невербальной информации образно-предметного (иконического) характера. Молем, однако, не было проделано детальное исследование на этот предмет разных видов экстралингвистической информации речи, что мы и проделали.
Согласно нашей гипотезе (основанной, кстати, на ряде экспериментальных фактов и другого рода), имеется принципиальное различие в механизмах обработки мозгом собственно речевой (вербальной) и невербальной (экстралингвистической) информации (см. разделы данной статьи «Человек и ЭВМ – проблемы взаимопонимания» и «Двухканальная природа речевого общения»). Различия эти, в частности, и должны были проявиться в особенностях восприятия мозгом как собственно речевой, так и разных видов экстралингвистической информации.
Первое, что мы сделали, – это попытались прокрутить наоборот для группы испытуемых (слушателей) пленку с записью уже знакомых читателю эмоционально окрашенных фраз, произнесенных О. Басилашвили, а также пленки с записями эмоционально окрашенных в разные тона голосов певцов.
Результаты показали, что восприятие наоборот практически не лишает возможности слушателей правильно воспринимать эмоциональную окраску по сравнению с нормой. Несколько сниженный общий процент правильных восприятий можно отнести за счет необычности «наоборотного» звучания речи и пения. Некоторая тренировка практически сглаживает эти различия.
Таким образом, человек, не понимая ни одного слова в «наоборотной» речи и пении, прекрасно и притом сходу (безо всякой тренировки) распознает язык эмоций в инвертированном во времени варианте.
Способен рядовой слушатель (по нашим данным) распознать в «наоборотном» звучании и другой вид экстралингвистической информации – возраст говорящего. Для этой цели были использованы те же самые эмоционально окрашенные фразы О. Басилашвили, а испытуемым давалось задание определить только возраст говорящего и больше ничего. Результаты показали, что слушатели в целом близко к истине определили возраст О. Басилашвили. Но при этом выяснилась любопытная деталь – возраст артиста, по оценкам слушателей, оказался зависимым от эмоциональной окраски его голоса (!): эмоции гнева и страха дали максимальный возраст (около 50 лет), а эмоции радости и нейтральное звучание привели к минимальным оценкам (около 39 лет). Поскольку разница по оценкам возраста немалая – около 10 лет – людям, у желающих выглядеть помоложе – а это прежде всего относится к прекрасному полу, – есть шанс «помолодеть», воспользовавшись знанием этой психологической закономерности.
Если же говорить серьезно, то здесь мы сталкиваемся с весьма важным законом взаимодействия и взаимовлияния различных видов экстралингвистической информации на уровне ее восприятия и обработки мозгом человека. Данные эти могут оказаться не бесполезным и в криминалистике в случае рассмотрения свидетельских показаний об опознании возраста человека по его голосу.
А способен ли человек узнать своего знакомого, если его голос будет звучать наоборот? Проведенные нами опыты показали, что слушатели – а их было 26 человек – прекрасно справились с этой задачей, определив по голосу (в среднем с точностью 86 %) 20 своих знакомых (10 мужчин и 10 женщин) и отличив их от двух совершенно незнакомых людей, голоса которых были специально включены в магнитофонную тестовую запись, прокручиваемую наоборот. Пол диктора при этом был неправильно воспринят всего лишь в 1 % случаев, что соответствует точности определения в этих условиях пола диктора по его голосу с надежностью 99 %!
Опрос испытуемых-слушателей показал, что при определении по «наоборотному» голосу своих знакомых и эмоций они в значительной мере ориентировались на сохраняющиеся для нашего слуха в этих условиях тембровые особенности голоса. Теоретические расчеты, а также экспериментальные их проверки показывают, что при инвертировании во времени интегральные спектры голоса, ответственные за индивидуально-эмоциональные особенности тембра, сохраняются. Это дает основание полагать, что способность слушателей к восприятию невербальных характеристик голоса основывается именно на интегральных, т. е. усредненных за определенное время, характеристиках спектра. Согласно современным научным представлениям, такой механизм целостного восприятия характерен для работы правого полушария мозга человека.
Рис. 6. Зависимость правильных оценок различных видов речевой информации от ограничения спектра высоких частот.
Экстралингвистическая информация голоса оказывается более помехоустойчивой (по сравнению с лингвистической) не только по отношению к действию шума, но и по отношению к частотному ограничению спектра. График показывает, что ограничение высоких частот до 300 Гц полностью разрушает лингвистическую информацию. Определение же эмоций в таком сигнале, так же как и узнавание диктора, в значительной степени сохраняется
Как уже упоминалось, речь при «наоборотном» звучании слушателю непонятна, что говорит о принципиально иных механизмах декодирования мозгом. Считается, что механизм этот заключается в тонком, детальном во времени посегментном (пофонемном, послоговом) анализе динамики формантной структуры речевого сигнала. Поскольку же динамика эта в «наоборотном» звучании искажена (инвертирована) во времени, то мозг, естественно, и не может декодировать речевую информацию в этих условиях.
Но необходимо уточнить: обычно не может, поскольку оказалось, что Лада Самсонова это делать может. Нам удалось также узнать, что «наоборотным языком» владеют и другие люди, правда, в разной степени совершенства. Один из них – молодой человек по имени Орест также был гостем нашей лаборатории, и мы записали на магнитофон его диалог с Ладой на этом необычном языке. Данные эти обрабатываются и составят предмет специальной работы.
Что же касается языка эмоций в «наоборотном» виде, то, как показали наши опыты, он доступен каждому из нас.
Одним из важнейших принципов работы мозга, отличающих его от многих технических систем, в частности ЭВМ (по крайней мере, старого типа), является принцип параллельной обработки многих разных видов информации, поступающей по разным анализаторным каналам (слух, зрение, кожно-тактильное, мышечное чувство и др.) и даже в пределах одного и того же канала. Применительно к звуковой речи мозг можно считать двухканальной системой, несмотря на кажущуюся одноканальность речевого акустического сигнала.
Таким образом, традиционная одноканальная схема речевой коммуникации (заимствованная в свое время у Шеннона) нуждается в принципиальной коррекции. В свете приведенных в этом разделе данных и других современных представлений, двухканальная природа звуковой речевой коммуникации иллюстрируется рисунком 6, где указанные каналы обозначены терминами «лингвистическая информация» и «экстралингвистическая информация». Экстралингвистический канал, в свою очередь, состоит из множества субканалов по характеру разных видов этого рода информации.
Рис. 7. Традиционная схема речевой коммуникации, представленная одним каналом (А), и схема речевой коммуникации, подчеркивающая ее двухканальную природу
В мозгу человека осуществляется функциональное разделение этих каналов по принципам обработки информации: левое (лингвистическое) полушарие осуществляет посегментный анализ речевого сигнала, ориентируясь на тонкую динамику его формантной структуры в микроинтервалах времени, а правое (экстралингвистическое) полушарие использует целостный принцип анализа на основе сравнения интегрального акустического образа сигнала с хранящимися в памяти паттернами (эталонами) образцов этого вида информации.
Двухканальный принцип работы мозга проявляется не только в условиях восприятия речи, но и в процессе формирования (порождения) речевого высказывания в форме принципиально разных функций больших полушарий мозга в этом процессе.
Рис. 8. Вероятность (Р, %) правильного восприятия различных видов речевой информации при увеличении соотношения шум/сигнал (дБ): 1 – лингвистической, 2 – эмоциональной, 3 – половой принадлежности диктора.
Помехоустойчивость экстралингвистических видов информации (эмоциональной и о половой принадлежности диктора) намного выше, чем лингвистической (речь). При действии сильного шума (при соотношении сигнал/шум=+16 дБ) лингвистическая информация полностью разрушается (слушатели не могут разобрать ни одного слова), но восприятие эмоций возможно с вероятностью более 50 %, а пола диктора – более 80 %
Объективной основой разделения мозгом каналов лингвистической и экстралингвистической коммуникации являются различия в акустических средствах и принципах кодирования этих двух видов речевой информации. Если для вербальной информации определяющим является динамика формантной структуры сигнала, то для экстралингвистической, как показали наши исследования, особую роль приобретают динамика основного тона голоса и другие особенности просодической организации речи. Таким образом, лингвистический и экстралингвистический каналы оказываются обособленными (по целому ряду критериев) во всех звеньях системы речевой коммуникации. По отношению к действию шума эта обособленность проявляется в разной помехоустойчивости лингвистической и экстралингвистической информации: помехоустойчивость экстралингвистической информации оказывается выше (рисунок 7).
Несомненны также различия между указанными каналами и в эволюционно-историческом аспекте: экстралингвистическая коммуникация является значительно более древней по сравнению с лингвистической. Возникновение в процессе эволюции слова как весьма совершенного средства передачи любых видов информации не привело, однако, к умалению эволюционно древней формы экстралингвистической коммуникации. Она продолжает сосуществовать наряду со словом, существенно дополняя и видоизменяя его смысл, а во многих случаях претендуя на самостоятельность. В огромном большинстве ситуаций речевого общения более важным является не столько ЧТО говорит человек, сколько КАК говорит и КТО говорит. Доминирующая роль экстралингвистической информации представляется очевидной в таких специфических видах звуковой коммуникации, как искусство сценической речи и пения. Важнейшим и почти неизученным свойством двухканальной системы речевой коммуникации является взаимодействие каналов лингвистической и экстралингвистической информации, появляющейся во всех звеньях данной системы и на всех этапах обработки речевой информации мозгом.
Наиболее удобным, оптимальным, с точки зрения человека, было бы введение информации в ЭВМ не при помощи клавиатуры, а непосредственно с голоса, т. е. естественным речевым средством общения между людьми. Однако сегодня ЭВМ, как известно, не понимает речь человека в должной мере и с должной надежностью, и пользователю нужно прибегать к услугам целого штата «переводчиков» (программистов, операторов), осуществляющих ввод информации в ЭВМ на особом, понятном для ЭВМ языке, а также дешифрующих выданную машиной информацию.
Создание машин 5-го поколения, надежно понимающих речь любого человека, а также говорящих машин является глобальной задачей мировой науки, в решении которой значительные успехи принадлежат Японии, США, Франции. Однако задача эта оказалась настолько трудной, что полностью ее решить пока что не удалось. Например, машина легко распознает речь одного человека или нескольких знакомых ей дикторов, но не желает распознавать незнакомых, понимает речь взрослых и не хочет понимать детей. Если же и удается расширить круг дикторов, то тут же приходится ограничивать объем словаря. Даже могучие современные ЭВМ не в состоянии пока что решить в полной мере такую детскую задачу, как письмо под диктовку. Пусть даже знакомый машине диктор будет читать знакомый ей текст, но простуженным голосом, или не очень внятно, или в шуме – машина его не поймет.
Специалист по данной проблеме доктор технических наук М. Сулуквадзе, работающий в Институте систем управления Академии наук Грузинской ССР, считает, что «автоматическое распознавание речи следует считать одной из наиболее сложных проблем технической кибернетики. Мы не уверены, что она будет полностью решена и через 50 лет, то есть к 2034 году. Под термином „полностью“ подразумевается уровень восприятия и понимания речи человеком в реальных условиях его речевого взаимодействия с другими людьми».
Рис. 9. Раритет
Причина столь упорного «нежелания» ЭВМ научиться в совершенстве понимать речь кроется в индивидуальных и эмоциональных особенностях речи людей, сильно искажающих ту фонетическую структуру стандартного речевого сигнала, на распознавание которого заранее настраивается машина. Так, известно, что речевая информация кодируется формантной структурой (частотой формант и их динамикой). Но частота особенно первых формант существенно зависит от частоты основного тона голоса: повышается при повышении голоса и снижается при понижении основного тона речи. Изменения во времени основного тона голоса – это важнейшее средство эмоциональной выразительности (интонации голоса), и происходят они в связи с эмоциями в пределах до одной, полутора и даже двух октав (!), как это наблюдается при сильном эмоциональном возбуждении. Это и приводит к сильнейшей деформации всей спектральной структуры речи и непониманию речи машиной. По данным Г. Фанта, женские и детские голоса, имеющие повышенную, по сравнению с мужскими, частоту основного тона, характеризуются и повышенными формантными частотами (в среднем на 17–25 %).
Очевидно, в мозгу есть механизм, учитывающий информацию о повышении средних частот формант в связи с повышением основного тона голоса (высота голоса). Потому-то нам практически безразлично, на какой высоте основного тона голоса произносятся слова: произносит ли их мужской, женский или детский голос – разборчивость, понятность речи обеспечиваются.
Но перечисленные трудности – это лишь малая толика всех их, стоящих на пути обучения ЭВМ пониманию речи. Образно говоря, все виды речевой информации – лингвистической и экстралингвистической – как бы «растворены» в звуке голоса человека. Наш слух не испытывает затруднений в их разделении и учете, а машина «затрудняется». Поэтому можно надеяться, что изучение индивидуально-эмоциональных особенностей речи и механизмов, на которые опирается наш слух и мозг при их разделении, позволит наконец окончательно решить и проблему ее автоматического распознавания. Может быть, здесь пригодятся данные о том, что для восприятия и переработки логической и эмоциональной информации речи в мозгу человека имеются два специализированных и вместе с тем взаимодействующих отдела: левое полушарие мозга – для логики, правое – для эмоций. Кстати, в одной из работ под редакцией виднейшего американского специалиста по автоматическому распознаванию речи Уайна Ли описаны алгоритм и устройство распознавания речи, основанные на принципах работы правого полушария мозга (т. е. целостного, а не посегментного анализа, с учетом просодических и экстралингвистических характеристик речевого сигнала).
Взаимодействие человека с компьютером предполагает создание на базе ЭВМ говорящих роботов. Все, конечно, слышали по радио в научно-популярных передачах лишенный каких-либо эмоций голос робота. Безэмоциональность – характерное его свойство, которое и проявляется в голосе. А почему, собственно, робот и его голос должны быть безэмоциональными? Нельзя ли «оживить» его голос интонациями человеческой речи? Ведь эмоциональная окраска голоса делает его эстетически более приятным, психологически совместимым с восприятием человека, а кроме того, она отнюдь не бесполезный акустический аккомпанемент речи, а несет очень нужную информацию, например, о степени важности сообщения, грозящей опасности и т. п.
Вдохнуть эмоции в бездушный мозг робота – одна из задач кибернетической науки, связанная с выделением и формализацией инвариантных акустических признаков, ответственных за эмоциональную окраску звука.
Ясно, что «оживление» речи робота – одна из многих технических задач, решить которую нельзя без знания алфавита акустического языка эмоций. Но, чтобы заложить этот алфавит в электронный мозг робота, необходимо сначала выявить, потом формализовать признаки, ответственные за эмоциональность голоса.
Таким образом, решение проблемы полного взаимопонимания человека и ЭВМ требует эмоционализации компьютера. Необходимо, чтобы робот, так же как и человек, услышав, например, фразу «Я очень рад вас видеть!», произнесенную не нейтрально, а насмешливым голосом, мог бы не только четко воспринять слова (в чем он сейчас явно затрудняется), но и понять эмоциональную интонацию, отрицающую смысл слов. Робот должен понимать наш язык эмоций.
Трудно переоценить практическое значение такого рода автомата, например, для контроля психологического состояния космонавтов, летчиков-испытателей и многих других операторов, которые по характеру своей работы находятся в сложной экстремальной обстановке и от точности действий которых зависит успех дела. Уже есть попытки создания машины, реагирующей на эмоции в голосе человека. Одна из них на основе оценки темпо-ритмических характеристик речи принадлежит группе инженеров, работающих в содружестве с фонетистом Э. Л. Носенко, о чем они сообщили на симпозиуме «Речь, эмоции и личность». На аналогичное устройство, но на основе динамики основного тона получили авторское свидетельство ленинградские ученые (Галунов, Манёров, 1981). Под руководством П. В. Симонова и М. В. Фролова внедрено устройство для регистрации эмоций авиаторов и т. д.
Рис. 10. Проблема человека – проблема робота
Машину-автомат, безошибочно опознающую личность человека по его голосу, наверное, охотно возьмут на службу и криминалисты, ведь в ее беспристрастности и объективности трудно усомниться. Над теоретическими основами создания такой машины успешно трудится грузинский ученый Г. С. Рамишвили.
В заключение отметим, что представленные в статье данные о восприятии человеком эмоциональной интонации голоса как одного из важнейших средств экстралингвистической коммуникации впервые получены нами с применением модели не только актерской, но и вокальной речи (пения). Комплекс этих исследований позволил выдвинуть представление об эмоциональном слухе как специфической системе обработки этого рода информации в мозгу человека, входящей в структуру экстралингвистической коммуникации и имеющей древнейшие основы. В ряде работ нами показано, что степень развитости эмоционального слуха может служить одним из объективных критериев принадлежности человека к художественному типу личности (по И. П. Павлову). Практической реализацией этих исследований явилось внедрение разработанных нами тестов и методик для профотбора лиц художественных профессий.
Представление о речевой коммуникации как о двухканальной системе является, несомненно, плодотворным в бионическом смысле, т. е. для создания новых, более совершенных систем автоматического анализа и синтеза речи с помощью ЭВМ. Можно с уверенностью сказать, что дальнейшие успехи в решении проблемы автоматического анализа и синтеза речи будут зависеть от того, насколько полно удастся техническими средствами смоделировать принцип парной работы полушарий головного мозга человека с учетом функциональной специализации каждого из них при восприятии и переработке (а также генерировании) разных видов речевой информации: собственно речевой (лингвистической) и экстралингвистической.