- Как эмоции влияют на речь
- Особенности проявления эмоций в речи
- Упражнение
- Формирование эмоциональной окрашенности речи. статья по чтению на тему
- Скачать:
- Предварительный просмотр:
- По теме: методические разработки, презентации и конспекты
- Вартанов А.В. Антропоморфный метод распознавания эмоций в звучащей речи // Национальный психологический журнал — 2013. — №2(10) — с.69-79.
- Аннотация
- О параметрах речевого сигнала
- Четырехмерная сферическая модель эмоций
- Результаты выявления параметров речевого сигнала в соответствии с предлагаемой антропоморфной моделью
Как эмоции влияют на речь
Эмоции — важный компонент коммуникации и говорящий человек активно использует этот инструмент, чтобы улучшить качество и информативность сообщения.
Особенности проявления эмоций в речи
Эмоции делают звучащую речь более интенсивной и помехоустойчивой.
Эмоциональная окраска речи воспринимается и распознаётся в правом полушарии мозга.
Эмоционально -выразительная речь обеспечивается работой дыхательной системы, голосовых связок и резонаторов.
Слуховой анализатор обеспечивает контроль интенсивности выражения эмоций.
Для каждой эмоции характерен определённый набор акустических признаков, которые становятся информативными и позволяют на слух определить настроение человека.
Экспериментально доказано, что человек способен на слух распознавать эмоциональную окраску звуковых сигналов, издаваемых обезьянами.
Эмоциональность речи возрастает в тех случаях, когда говорящий человек испытывает нехватку времени для сообщения, снижается уверенность в том, что информация в точности донесена до слушателя или, когда недостаточно логических аргументов для убеждения собеседника.
Эмоциональное напряжение приводит к существенным изменениям в устной речи:
- появляются ошибки, оговорки;
- увеличивается длина отрезка речи, произносимой без пузы;
- изменяется высота голоса, темп речи и чёткость артикуляции;
- упрощается лексика — для построения высказывания используются «привычные» и короткие слова;
- отмечаются ошибки грамматического согласования языковых единиц во фразе;
- в речи появляется нерешительность: говорящий задерживается с ответом на вопрос или не завершает фразу.
Всегда находить слова и держать инициативу беседы в своих руках поможет наличие в голове речевых шаблонов, которые специально разработаны для определённых коммуникативных ситуациях.
Упражнение
Прочитайте вслух речевые шаблоны, попробуйте проговорить каждую фразу эмоционально и уверенным голосом.
Источник
Формирование эмоциональной окрашенности речи.
статья по чтению на тему
В условиях развития языка и общей культуры граждан России остро встает проблема овладения детьми культурой речи, в том числе и ее выразительностью. Окружающий мир отражается в маленьком человеке своей духовной стороной посредством отечественного языка.
Задача развития речи ребенка не сводится, как это принято считать, к обучению правильно и связно говорить, а предполагает постепенное и качественное формирование процессов слушания, говорения, чтения и письма, которые очень влияют друг на друга. Например, недоразвитие слушания может породить трудности в овладении письмом, а некачественное чтение – отразиться на правописании.
Работу над выразительностью необходимо начинать с букварных страниц, то есть надо не просто читать слово, а обязательно придавать ему эмоциональную окраску. Например, возьмем слово мама. Сначала дети его читают по слогам, потом полностью. Затем учащимся предлагаются придумать ситуации, в которых это слово должно читаться с разной интонацией: радостно, печально, с удивлением, когда маму надо позвать, маме надо пожаловаться, маме сказать о том, что вы ее очень любите. Дети любят играть, они активно участвуют в такой игре. Аналогично проводится работа с предложением.
Скачать:
Вложение | Размер |
---|---|
formirovanie_emotsionalnoy_okrashennosti_rechi.docx | 20.11 КБ |
Предварительный просмотр:
Формирование эмоциональной окрашенности речи.
(Развитие выразительной речи младших школьников)
Современный этап развития общества характеризуется требованием новых подходов к обучению и воспитанию подрастающего поколения. Сегодня общество нуждается в образованной и культурно развитой личности, формирование которой необходимо начинать с детства. Активное и целенаправленное приобщение подрастающего поколения к культурным ценностям своего народа — задача первостепенной важности — Хранилищем народной культуры является язык народа.
В условиях развития языка и общей культуры граждан России остро встает проблема овладения детьми культурой речи, в том числе и ее выразительностью. Окружающий мир отражается в маленьком человеке своей духовной стороной посредством отечественного языка.
Высокая культура разговорной и письменной речи, хорошее знание и чутье родного языка, умение пользоваться его выразительными средствами, стилистическим многообразием является самым верным средством и самой надежной рекомендацией для каждого человека в его общественной жизни и творческой деятельности.
Наши дети нередко терпят неудачи в учебе, общении и, в конечном итоге, в жизни вовсе не потому, что они глупы, бездарны, а оттого, что ни школа, ни родители не позаботились о должном развитии их речи.
Задача развития речи ребенка не сводится, как это принято считать, к обучению правильно и связно говорить, а предполагает постепенное и качественное формирование процессов слушания, говорения, чтения и письма, которые очень влияют друг на друга. Например, недоразвитие слушания может породить трудности в овладении письмом, а некачественное чтение – отразиться на правописании.
Разные виды речевых умений формируются по-разному: одними можно овладеть на основе подражания, другими только в ходе специального обучения.
Выразительное чтение предполагает обучение правильному произношению слов при чтении, развитие темпа речи и чтения, соотнесение его с содержанием высказывания и текста, выработка умения убыстрять и замедлять темп чтения, умение увеличивать и уменьшать силу голоса (от громкой речи до шепота и наоборот) в зависимости от ситуации и коммуникативной задачи высказывания. Большое внимание уделяется развитию четкой дикции, отработке правильной артикуляции гласных и согласных звуков в словах и фразах. Проводится работа над интонацией (темп, ритм, тон, логическое ударение, мелодика речи и чтения). Развитие речи детей является одной из ведущих задач в современной начальной школе. Известно, что хорошо развитая речь младших школьников оказывает непосредственное влияние на обучение детей не только языку, но и всем учебным дисциплинам, являясь показателем интеллектуального развития. Трудно стать активным участником общественной жизни, интересным собеседником, не владея связной речью. Современная система работы по развитию связной речи учащихся выделяет в качестве основной задачу формирования умений воспринимать и воспроизводить текст и сознательно создавать собственное высказывание в устной и письменной форме.
Обучая младших школьников умению читать выразительно, учитель воздействует на эмоции детей, а это помогает правильно раскрыть основную идею произведения, показать красоту и богатство русского языка, привить вкус и любовь к литературе.
Выразительное чтение — неотъемлемая часть любого урока в начальной школе. Оно оказывает огромное влияние на общее развитие учащихся.
Как много умеет в этой жизни маленькое человеческое слово! Оно, как волшебник, может быть добрым и злым. Недаром народные пословицы подмечают:
То же слово, да не так бы молвить.
Доброе слово дороже богатства.
Не шути словом — слово пуще стрелы ранит.
Доброе слово и кошке приятно.
Сказал — как топором отрубил.
В чем же: заключается сила слова? Может быть, стоит внимательнее прислушиваться к их звучанию, постараться заглянуть в разные словари и узнать сведения об их значении, рождении, изменениях.
Большое влияние на учащихся оказывает выразительное чтение учителя. Чем выразительнее прочитал учитель, тем глубже и устойчивее впечатление, оставшееся в сознании юных слушателей, и сознательнее дальнейшая работа по анализу прочитанного. Чтение учителя доставляет детям эстетическую радость, раскрывая благородство нравственного облика героя, вызывая глубокие эмоциональные переживания — «упражнения в нравственном чувствовании», как называл их К.Д.Ушинский. Наблюдая образцовое чтение учителя, учащиеся стремятся и сами при чтении раскрывать сове отношение к прочитанному всеми доступными им средствами, размышлять над текстом и находить верные интонации.
Работу над выразительностью необходимо начинать с букварных страниц, то есть надо не просто читать слово, а обязательно придавать ему эмоциональную окраску. Например, возьмем слово мама. Сначала дети его читают по слогам, потом полностью. Затем учащимся предлагаются придумать ситуации, в которых это слово должно читаться с разной интонацией: радостно, печально, с удивлением, когда маму надо позвать, маме надо пожаловаться, маме сказать о том, что вы ее очень любите. Дети любят играть, они активно участвуют в такой игре. Аналогично проводится работа с предложением.
Через школу и уроки чтения проходят все, а вот привычка к чтению художественной литературы и вкус возникают не у каждого. Почему? Ведь в арсенале учителя сейчас большое количество хороших учебных книг по чтению! Чтобы ответить на этот вопрос, нужно решить: а что же главное на уроке чтения? Одни считают, что главное — знание. Обширное, прочное. И это верно, но, с другой стороны, надо от знаний идти к чувствам — это главное! Отсюда и задача уроков чтения
— вызвать в душе учеников отклик, определенные чувства, без которых невозможно глубокое восприятие жизни и ее понимания. А ведь искусство надо воспринимать душой.
Прежде чем просить ребенка выразительно прочитать текст, нужно убедиться: понял ли он тему, основное содержание и смысл текста. Сумел ли проникнуться чувствами, которые выразил автор в своем произведении, пережил ли сам эти события, поставив себя на место героев, представил ли ясно, четко, целостно, что же случилось и что следует довести до слушателей.
Эмоциональное отношение детей к героям произведения – важный фактор нравственного воспитания. Пережитое младшими школьниками чувство симпатии или отвращения к герою сохраняется надолго. Нередко для усиления эмоционального воздействия на детей используется метод сравнения и противопоставления.
Умение проникнуть в эмоциональный настрой всего произведения или понять состояние героя включает в себя: способность находить в тексте слова, отражающие эмоциональное состояние героя, определять это состояние, соотнести с его поступком, проникнуться сочувствием, симпатией или антипатией к нему, то есть умение определять свое отношение, отношение автора, а затем решать, какие будут использованы интонационные средства для передачи всего этого при чтении вслух.
В работе над выразительностью речи необходимо уделять большое внимание средствам речевой выразительности — это интонация, логическое ударение, различные паузы, темп, сила и высота голоса. Выразительное чтение зависит от умения читающего владеть своим голосом, его свойствами. Голос должен быть хорошо развит, гибок, послушен, звонок и достаточно громок.
При работе над развитием выразительного чтения необходимо выяснить жанр произведения. Это важно потому, что каждый жанр требует особого чтения: русская песня и сказка — напевности, медленного типа чтения; лирические стихотворения — задушевности; гражданская поэзия — четкости, торжественности звучания; басни — особого разговорного жанра с выделением специфической структуры басни.
Обучая младших школьников выразительному чтению, педагог тем самым проводит определенную воспитательная работу, побуждая детей мысленно жить вместе с героями произведения: радоваться и возмущаться, гордиться и ненавидеть, наслаждаться и поддаваться печали. Такая работа дает положительные результаты уже в первом классе. Дети не стесняются читать выразительно, они хотят выступать перед публикой.
Эмоциональная отзывчивость дает школьнику развитие и формирование духовно-нравственной стороны, обогащение индивидуального опыта эмоционально-эстетических, гуманистических и этических суждений, отношение к людям и природе. Чтение художественной литературы развивает их эмоциональную активность, позволяя удовлетворять эстетические потребности учащихся в общении в прекрасным. Формируются такие качества личности как, анализ связанный с сутью взаимоотношений, сопереживание, осознание собственного желания проявлять эмоциональный отклик – являющийся составной частью эмоциональной отзывчивости. При работе с литературными художественными произведениями могут использоваться различные методы и приемы работы. Важное место отводится выразительности чтения и качеству подачи текста. Именно через качество подачи литературных текстов, дети постигают красоту поступков героев, пейзажных зарисовок, поэтичность образов, позиции автора к описываемым событиям, жанровое своеобразие произведения.
Чтение — предмет универсальный. Если мы хотим научить ребенка писать, решать, разбираться в законах природы и общества, воспитать у него высокие нравственные качества, научить его мыслить, надо научить его читать в полном смысле этого слова. В дальнейшем наши ученики с удовольствием будут читать художественную, научную, энциклопедическую литературу, будут успешно учиться по всем предметам.
По теме: методические разработки, презентации и конспекты
ТРУДНОСТЬ ТЕХНИКИ В МНОГООБРАЗИИ СОСТАВЛЯЮЩИХ, которые образуют в совокупности сложный комплекс психофизических и физических (мышечно – двигательных качеств и свойств). Серьезную проблему представляет.
Младший школьный возраст соответствует аффективному (эмоциональному) этапу формирования личности. «В это время возрастает подвижность нервных процессов, причем процессы возбуждения преобладают н.
Пояснительная записка к программе «Формирование эмоциональной стабильности и положительной самооценки обучающихся».
Эта презентация была подготовлена по теме » Нейтральные и эмоционально окрашенные слова».
Цель: ознакомление педагогов с основными арт-терапевтическими направлениями, способствующими созданию благоприятного психологического климата в детском коллективе.
Цель: ознакомление педагогов с основными арт-терапевтическими направлениями, способствующими созданию благоприятного психологического климата в детском коллективе.
Занятие № 7 к авторской программе «Речевая копилка».
Источник
Вартанов А.В. Антропоморфный метод распознавания эмоций в звучащей речи // Национальный психологический журнал — 2013. — №2(10) — с.69-79.
Аннотация
Предложен новый эффективный метод автоматического распознавания эмоций по речевому сигналу, основанный на четырехмерной сферической модели эмоций и принципах кодирования информации в нервной системе. В результате разработан и экспериментально протестирован принцип относительного кросс-частотного амплитудно-вариабельного кодирования эмоций в речевом сигнале. Проверялась гипотеза о том, что речь является многоканальным (разнесенным по частотам) сигналом, в каждой полосе которого возможны независимые быстрые микро-изменения амплитуды. Показано соответствие выделенных параметров речевого сигнала и субъективного восприятия тех же образцов (коротких слов «да» и «нет») в системе формализованных параметров четырехмерной психофизиологической модели эмоций. Полученные параметры (факторы) можно охарактеризовать как бимодальные спектральные фильтры. Фактор 1 определяет изменение звукового сигнала по оси знака эмоций – чем больше вклад данного компонента по сравнению с другими, тем положительнее (лучше, полезнее) оценивается объект высказывания. Фактор 2 показывает степень информационной неопределенности ситуации – удивление в противоположность уверенности (спокойствию). Фактор 3 характеризует притяжение (любовь), при этом для набора слов «нет» он сопровождается отсутствием активного отвержения, а для набора «да» – положительной оценкой (знаком). Фактор 4 соответствует характеру отвержения, определяет, будет ли агрессивная (активная) или пассивная (страх, бегство) реакция. Полученные результаты в целом подтверждают продуктивность предлагаемого антропоморфного подхода к разработке технических систем, в частности, к методам обработки речевого сигнала и представления данных. Обнаруженное совпадение подтверждает и выделенные ранее параметры психофизиологической модели, дополнительно обосновывая предпочтительность (по сравнению с другими известными в литературе) именно такой системы классификации эмоций, как с точки зрения размерности, так и в отношении ориентации осей пространства модели.
Принята к публикации: 03.03.2013
Разделы журнала: Психофизиология
Ключевые слова: эмоции; речевой сигнал; антропоморфный метод
Известно, что речь человека, находящегося в различных эмоциональных состояниях, различается по целому ряду показателей. К числу наиболее информативных относят, прежде всего, характеристики просодической группы, которые тонко отражают процессуальную сторону устных высказываний и, в первую очередь, изменяются при реакциях аффективного плана (Златоустова, 1957; Михайлов, Златоустова, 1987; Никишкян, 1987). Задача автоматического распознавания звучащей речи и, в частности, ее эмоциональной окрашенности является междисциплинарной и постоянно привлекает исследователей разных специальностей – не только лингвистов, но и математиков, программистов, психологов, физиологов. От ее решения зависит прогресс современных автоматизированных систем управления, реабилитации и протезирования, систем безопасности, срочного оповещения и т.п. Решение этой задачи имеет большое научное значение для всех сфер фундаментальных исследований человека и информационных технологий. В последние годы явно усилился интерес к анализу речевого сигнала, рассматриваемого в качестве наиболее удобного объективного показателя выражения эмоций, эмоционального состояния человека (Сидоров, Филатова, 2012). Это касается не только сфер деятельности с повышенной ответственностью – космонавтики, авиации (летчики, диспетчеры аэропорта), обслуживания АЭС и пр., которые изначально доминировали в этом отношении (Хроматиди, 2005; Соловьева, 2008; Chen, 2008; Siging, 2009; Фролов, Милованова, 2009; Розалиев, 2009; Калюжный, 2009; Перервенко, 2009; Morist, 2010), но широкой бытовой сферы.
В интернете, новостных лентах и популярных изданиях периодически появляются сообщения о все более успешных попытках создания программ и бытовых устройств, реагирующих на эмоции в голосе человека. Например, «Ноосфера» сообщает, что «инженеры из Рочестерского университета (Великобритания) разработали программу, способную распознавать эмоции человека по его речи, даже не понимая смысла сказанного. Программа ориентируется на базу звукозаписей, состоящую из календарных дат, произнесенных профессиональными актерами с разными интонациями. Алгоритм анализирует 12 характерных параметров речи, таких как высота и громкость звука. На их основании он определяет одну из шести эмоций. По словам разработчиков, точность распознавания составляет 81 процент — значительно лучше 55 процентов, которых удавалось добиться в предыдущих аналогичных исследованиях. Авторы уже разработали первое коммерческое приложение – программу, отображающую на экране веселый или грустный смайлик в зависимости от результата анализа записанного голоса. Это лишь первый этап. Авторы программы фантазируют, что в дальнейшем смартфоны смогут менять цветовую схему интерфейса или выбирать подходящую музыку в зависимости от настроения владельца» (Шпикуляк, 2012). На сайте Animal language отмечается, что, хотя изучение языка эмоций точными научными методами еще лишь начинается, но уже сейчас стало вырисовываться большое значение этой проблемы, как для теоретической науки, так и для практики (Animal language, 2013). При этом понятно, что решить эту задачу нельзя без знания алфавита акустического языка эмоций. Но, «чтобы заложить этот алфавит в электронный мозг робота, необходимо формализовать признаки, ответственные за эмоциональность голоса» (Animal language, 2013).
Однако, несмотря на множество исследований и коммерческих предложений в данной области, проблема автоматического распознавания эмоционального состояния говорящего по речи на данный момент не является полностью решенной, в частности, отсутствует модель описания речевых образцов в условиях проявления разных видов эмоций (Сидоров, Филатова, 2012). Процесс интерпретации (распознавания) эмоций человека по естественной речи является весьма сложной задачей, как в области математической формализации задачи, так и в плане поиска способов четкой конкретизации эмоционального состояния – однозначного детектирования эмоции по речевому сигналу. В настоящее время отсутствует универсальная теоретическая модель описания речевых образцов в условиях проявления разных видов эмоций (Филатова, Сидоров, 2012).
Это обусловлено целым комплексом взаимосвязанных проблем. С одной стороны, необходимо выделить в речевом сигнале те параметры, которые могли бы служить индикаторами эмоций. Здесь возникают проблемы их регистрации, математического анализа, поиска соответствующих алгоритмов и технических средств. Для решения этой задачи требуется четко задать «входные» и «выходные» данные, формально представить требуемый результат. С другой стороны, необходимы формальные, объективные методы для систематизации и классификации таких сложных явлений как эмоции человека. Нужно разработать адекватную модель и собрать базу данных – набор соответствующих «образцов» состояний и корреспондирующих им фрагментов речи. Получается порочный круг: чтобы решить одну задачу, надо уже иметь решение другой.
Тем не менее, научные исследования и практические разработки в этом направлении предпринимаются со все большей интенсивностью, подстегиваемой коммерческими возможностями. При этом, как правило, разработчики новых методов и инструментов анализа пользуются лишь собственным «здравым смыслом» и некоторыми теоретическими обобщениями психологов и фонологов. А последним для анализа эмоциональных явлений приходится пользоваться «стандартными», общедоступными инструментами объективного анализа речевых сигналов. Чтобы хоть как-то приблизиться к достижению практической эффективности, всем приходится упрощать задачу – при разработке новых методов анализа речевого сигнала ограничиваться отдельными аспектами эмоциональных феноменов, например, только интерпретацией знака эмоций (Филатова, Сидоров, 2012) или отдельных эмоций, наиболее важных для данной области применения. В итоге общая эффективность предлагаемых в настоящий момент средств невысока. Приведенный выше пример из «Ноосферы» наглядно это подтверждает: даже при решении задачи по распознаванию всего шести эмоций, результат сводится к примитивному бинарному действию. А метод в типичном случае базируется на стандартных алгоритмах сопоставления с образцом в расчете на простое количественное увеличение быстродействия и объема памяти (например, за счет «облачных» технологий) и размера «словаря» образцов.
О параметрах речевого сигнала
Литературный обзор, проведенный К.В. Сидоровым и Н.Н Филатовой, показывает, что на современном этапе можно выделить четыре группы объективных признаков и соответствующих методов, позволяющих различать речевые образцы: спектрально-временные, кепстральные, амплитудно-частотные и признаки на основе нелинейной динамики. (Сидоров, Филатова, 2012). Показано, что, основываясь только на одних простых спектральных характеристиках звукового сигнала, невозможно правильно распознавать и идентифицировать различные эмоции (Сидоров, 2011).
Спектрально-временные признаки отражают своеобразие формы временного ряда, спектра голосовых импульсов у разных лиц и специфику фильтрующих функций их речевых трактов. Они характеризуют особенности речевого потока, связанные с динамикой перестройки артикуляционных органов речи говорящего, и являются интегральными характеристиками речевого потока, демонстрирующими своеобразие взаимосвязи или синхронности движения артикуляторных органов говорящего. Амплитудно-частотные признаки также несут важную информацию. Большинство исследований в качестве наиболее информативных акустических коррелятов эмоциональных и функциональных состояний рассматривают ряд частотных, временных и мощностных характеристик голосового сигнала (Адашинская, Чернов, 2007). Как правило, стенические состояния ведут к возрастанию, а астенические – к понижению показателей основного тона, форманта и интенсивности. Обнаружена взаимосвязь акустических параметров речи, эмоциональных и функциональных состояний, обусловленная индивидуальными особенностями говорящих, что выражается в разнонаправленности изменений ряда временных и мощностных параметров речи (Адашинская, Чернов, 2007). Однако применение этих признаков не позволяет в полной мере использовать их в качестве инструмента идентификации эмоционально окрашенной речи (Сидоров, 2011).
В группе спектрально-временных признаков были выделены параметры, инвариантные к действию повышенного уровня сигнала, описывающие статистические характеристики речевого сигнала и основного тона, особенности спектральной структуры (Розалиев, 2009). Группа признаков эмоционально окрашенной речи по кепстральным коэффициентам позволяет отделить сигнал возбуждения от сигнала речевого тракта. Мел-частотные кепстральные коэффициенты широко используются в качестве набора признаков речевого сигнала, поскольку они учитывают психоакустические принципы восприятия речи и мел-шкалу, связанную с критическими полосами слуха (Siging, 2010; Сидоров, Филатова, 2012). Для группы признаков нелинейной динамики речевой сигнал рассматривается как скалярная величина, наблюдаемая в системе голосового тракта человека (Старченко и др., 2010). В настоящее время методы нелинейной динамики и нелинейной авторегрессии позволяют восстанавливать фазовый портрет аттрактора по временному ряду или по одной его координате. Экспериментально подтверждено, что выявленные отличия в форме аттракторов можно использовать для диагностических правил и признаков, позволяющих распознать и правильно идентифицировать различные эмоции в эмоционально окрашенном речевом сигнале. Так, К.В. Сидоров и Н.Н Филатова предложили модель интерпретации знака эмоции по правилу объединения нечетких множеств, характеризующих значения Rmax – усредненного максимального вектора реконструкции аттрактора по четырем квадрантам (Филатова, Сидоров, 2012). В работе Р.Ю. Романенко рассмотрена возможность применения вейвлет-анализа речевого сигнала с целью использования в системе распознавания речи (Романенко, 2010). Предлагается также проводить классификацию эмоционально окрашенной речи с использованием метода опорных векторов (Хейдоров, 2008). Как отмечалось около десяти лет назад, аппарат акустического анализа речи уже достаточно развит (Бабин, Мазуренко, Холоденко, 2004). Практически все наиболее часто используемые способы расчета акустических параметров речевого сигнала реализованы в известных и общедоступных математических компьютерных пакетах обработки сигналов (Бабин, Мазуренко, Холоденко, 2004), например, в пакетах SPL и IPPS фирмы Intel (Intel Developer Centers, 2013).
Таким образом, речь, порождаемая человеком, находящимся в различных эмоциональных состояниях, характеризуется целым рядом показателей, в том числе таких, которые могут отражать процессуальную сторону устных высказываний. Однако, формальные критерии, хотя и позволяющие успешно дифференцировать отдельные эмоции по речевым образцам, не могут дать общей картины изменения текущего состояния и отношения человека, поскольку не разработана антропоморфная система классификации эмоциональных проявлений в звучащей речи. Отправной точкой решения вышеописанной проблемы должна стать система, достаточно полно моделирующая процесс восприятия эмоций человеком, которая учитывает совокупность разных аспектов их проявления, в том числе, в речи. Многомерность эмоций, их проявление на различных уровнях отражения и деятельности, способность к слиянию и образованию сочетаний исключают возможность их простой линейной классификации (Вилюнас, 1984) или создания конечного дискретного набора определенных вариантов. Обычно выделяют как минимум десять типов эмоциональных отношений или так называемых фундаментальных эмоций, между которыми, однако, возможны плавные переходы.
Эти типы в достаточной мере условны, обозначая (в виде понятийных категорий) лишь наиболее важные места эмоционального континуума. Поэтому в разное время на основе различных экспериментальных методов и эмпирических фактов делались попытки выделить в этом разнообразии ограниченное число базовых факторов или основных «компонентов эмоционального качества», которые бы выступали по отношению к отдельным эмоциональным переживаниям как родовые исходные характеристики или «образующие». В настоящее время известен целый ряд таких независимых или частично перекрывающихся признаков и оснований для деления эмоциональных явлений. Это объясняется тем, что эмоции проявляются одновременно и во внутренних переживаниях, и в поведении, причем, и то, и другое обусловлено еще специфической физиологической активацией. При этом аппарат анализа речевого сигнала также должен, хотя бы в некоторой степени, воспроизводить процессы, позволяющие нервной системе человека правильно распознавать всю гамму эмоций, т.е. необходима антропоморфная модель эмоций.
Четырехмерная сферическая модель эмоций
Несмотря на всю сложность проблемы, предпринятое ранее исследование эмоциональных характеристик звучащего слова и семантики эмоций позволили построить универсальную четырехмерную сферическую модель эмоций (Виденеева, Хлудова, Вартанов, 2000; Вартанов, Виденеева, 2001; Вартанов, Вартанова, 2003; Вартанов, Вартанова, 2005). Эта модель объективирует и формализует в системе четырех количественных параметров все многообразие переживаний и различные проявления эмоций в речи, мимике, а также в семантике.
Построение модели проводилось экспериментально с помощью многомерного шкалирования субъективных различий между эмоциональными состояниями, задаваемыми специально созданными образцами. Чтобы уровнять и сделать определенным содержание этих образцов, в эксперименте использовалось одно и то же слово, произнесенное в разных эмоциональных состояниях. В одной серии использовалось слово «да», а в другой – «нет». Уже такие короткие одноударные слова, как свидетельствует практика актерского мастерства (Станиславский, 1959), вполне могут адекватно и полно отражать весь спектр эмоциональных проявлений. Эти слова, по сравнению с другими, несут более определенное и независящее от контекста значение, но, в то же время, они более нейтральны и допускают больше вариантов эмоциональной окраски при их произнесении. Из большого числа образцов, наигранных профессиональными актерами и «подловленных» в естественных условиях, было отобрано для каждого набора по 20 наиболее удачных, отражающих10 типичных эмоций, наиболее существенных для актерского исполнения (Станиславский, 1959). Наличие двух наборов таких образцов (противоположных по семантике) позволяет найти универсальные, независимые от конкретного слова параметры, определяющие именно проявление эмоций в речи.
В эксперименте регистрировались субъективные оценки степени попарного различия между звуковыми стимулами. Набор из 20 образцов в каждой из серий образовывал по 190 вариантов пар. Каждая пара предъявлялась не менее чем по 3 раза, т.е. всего 570 пар, которые следовали в случайном порядке. В экспериментах участвовало в общей сложности 25 взрослых испытуемых и 30 детей разных возрастов (с 1-го по 8-й классы). Кроме того, тем же методом исследовалась и семантика эмоций русского языка, для чего использовались различные наборы слов, обозначающих эмоции. Обнаружено, что и дети, и все взрослые одинаково успешно воспринимают и непосредственно сравнивают эмоциональные состояния другого, выраженные в интонациях речи – полученные матрицы всех испытуемых хорошо совпадали (коррелировали) друг с другом, что позволило далее объединить все данные и уменьшить случайный шум получаемых оценок, образующих матрицу различий.
Анализ (метрическим методом) многомерного шкалирования усредненных матриц различий в соответствующих сериях показал, что размерность полученного эмоционального пространства по всем критериям должна быть оценена как равная четырем. Расположение точек-стимулов в четырехмерном пространстве проверялось на сферичность. Оказалось, что в серии «да» вариативность радиуса четырехмерной сферы составляла всего 9,71%, а в серии «нет» – 9,94%. Это хорошо согласуется с теоретическими разработками о принципах кодирования в нервной системе (Соколов, Вайткявичюс, 1989; Соколов, 2001; Вартанов, 2011), на основе которых может быть построена антропоморфная нейротропная модель эмоций.
После вращения евклидовы оси пространства получили интерпретацию как определенные нейронные (мозговые) механизмы эмоций, а угловые характеристики – как субъективные качества эмоций. Первые две евклидовы оси пространства связаны с оценкой ситуации: ось 1 – по знаку (хорошо, полезно, приятно или плохо, вредно, неприятно), ось 2 – по степени информационной определенности (уверенность – удивление). Система третьей и четвертой осей связана с побуждением: ось 3 – притяжение, ось 4 – отвержение (оборонительная реакция), активное (агрессия) или пассивное (страх, затаивание) избегание. Это хорошо согласуется с известными мозговыми механизмами эмоций (Симонов, 1981; 2001). Так, ось 3 и положительное направление оси 1 (вроде бы сходные качества) отражают работу разных групп нейронов гипоталамуса – побудительных и подкрепляющих, которые хотя и определяют, казалось бы, одни и те же положительные эмоциональные состояния, но находятся между собой в конкурентных отношениях (что проявляется в ортогональности осей модели). Ось 2 и отрицательное направление оси 1 можно связать с работой гиппокампа (активизирующегося в условиях информационной неопределенности) и фронтальной коры (дорсальной ее части), а также с миндалины лимбической системой – вентральной части префронтальной коры. В целом префронтальная кора, являясь, как и гиппокамп, «информационной» структурой мозга, ориентирует поведение на сигналы высоковероятных событий. Ось 4, которая делит активные и пассивные оборонительные реакции, по-видимому, также описывает активность медиального гипоталамуса, точнее двух его структур, стимуляция которых вызывает оборонительные реакции нападения (положительное направление оси 4) или бегства, соответственно (отрицательное направление оси 4).
Оказалось, что три угла четырехмерной гиперсферы, выбранные в проекции осей 1-2, 3-4 и угол, образуемый движением точки между двумя этими плоскостями, задают такие субъективно переживаемые качества эмоций, которые описывал еще В. Вундт (Вундт, 1984). Это три качества: 1) эмоциональный тон (удовольствие – неудовольствие), 2) возбуждение – успокоение – угнетение, 3) напряжение – разрешение. При этом первый и второй углы упорядочивают все 10 основных эмоций по модальности: 5 эмоций, определяемых ситуацией и 5, определяемых собственной активностью. Но оказалось также, что при выборе другой системы угловых параметров – если взять три угла в системе осей 4-1, 3-2 и угол, образуемый движением точки между этими плоскостями, обнаруживается другая система классификации эмоций, описываемая при исследовании выражений лица – круговая система Х. Шлосберга ([Schlosberg, 1941) и сферическая модель Ч.А. Измайлова (Измайлов, Коршунова, Соколов, 1999), а также семантика Ч. Осгуд (Osgood, Suci, Tannenbaum, 1957). Она включает: 1) эмоциональный тон или знак (упорядочивает 6 основных эмоций по модальности), 2) активность или яркость эмоций (возбуждение – покой) и 3) эмоциональная насыщенность (сила проявления эмоций).
Таким образом, полученные данные показывают, что звучащая речь вполне определенно и достаточно точно выражает эмоциональное состояние говорящего, хорошо корреспондируя с другими важными для человека каналами: зрительным восприятием (по мимике и выразительным движениям), ощущением своего собственного состояния в самонаблюдении. Она также закреплена в языковых терминах (общественный опыт обозначения эмоций в социальном канале коммуникации). Предлагаемая четырехмерная сферическая модель может служить общей классификационной системой для эмоциональных явлений, объединяя, как физиологические представления о мозговых механизмах эмоциональной регуляции, так и известные психологические классификации, полученные на основе разных экспериментальных данных. Она также количественно объясняет все возможные нюансы и плавные взаимопереходы эмоций, представляя каждую конкретную эмоцию как линейную комбинацию выделенных основных психофизиологических параметров. По-видимому, у человека и животных существует специальный механизм эмоционального или чувственного отражения, необходимый для регуляции поведения и ориентировки в ситуации, работа которого может быть формально представлена в виде вышеописанной четырехмерной сферической модели. Наличие единого механизма во всех процессах позволяет представить все эмоциональные явления в одной и той же системе параметров. В результате данная модель, являясь антропоморфной (поскольку отражает субъективное отношение человека) и нейротропной (поскольку отражает нейронные механизмы), позволяет количественно описать и наглядно представить изменения текущего состояния человека или его эмоционального отношения. Она может стать базисом при конструировании устройства, которое в удобной форме представляет детектируемые по звучащей речи эмоциональные состояния человека.
Результаты выявления параметров речевого сигнала в соответствии с предлагаемой антропоморфной моделью
В качестве исходного материала для выявления параметров речевого сигнала, которые должны воспроизводить параметры вышеописанной сферической модели эмоций, были использованы те же образцы звуковых фрагментов, что и в эксперименте с субъективными оценками. Это – 20 образцов слова «да» и 20 образцов слова «нет» (средняя длительность 0,60 сек, стандартное отклонение 0,19 сек; минимальная длительность 0,3 сек, максимальная 0,98 сек; запись в полосе до 8000 Гц). После исследования возможных параметров, наиболее полно представляющих свойства данного набора образцов, было обнаружено, что наилучшим образом поставленной задаче соответствует показатель, вычисляемый по следующему алгоритму:
Для звукового фрагмента с помощью стандартных средств – быстрое преобразование Фурье со сглаживанием в минимальном скользящем окне порядка 10-15 мс вычисляется последовательностью мгновенных спектров мощности сигнала (в диапазон от 0 до 4000 Гц с шагом 50 Гц).
На основе последовательности мгновенных спектров в скользящем окне (исследовались окна порядка 50-200 мс) вычисляется показатель микро-вариативности (стандартное отклонение) амплитуды (квадратного корня от мощности) на каждой частоте.
Для вычисления интегральной оценки всего звукового образца использовалось простое усреднение предыдущего показателя по всему интервалу звучания и получения одного вектора (по частоте) для каждого звукового образца.
Такой алгоритм был выбран на основе теоретических предположений об общих принципах кодирования информации в нервной системе (Вартанов, 2011). Дополнительным основанием послужили наблюдения, впервые сделанные еще Ч. Дарвином о том, что эмоциональную выразительность голосу придает именно определенное «дрожание» тембра, что особенно важно для выразительности пения (Дарвин, 1940). Как отмечалось многими авторами, изменения громкости речи в макро-варианте на протяжении всего высказывания также может характеризовать эмоциональное отношение говорящего. Однако и быстрые микро-изменения амплитуды (в пределах короткого слова или междометия) также могут служить мерой изменения эмоционального состояния или отношения человека. При этом, для того, чтобы было возможно передать всю гамму эмоций, как показано выше, недостаточно только одного параметра, поэтому проверялась гипотеза о том, что речь – это многоканальный (разнесенный по частотам) сигнал, в каждой полосе которого возможны независимые быстрые микро-изменения амплитуды. То есть, основное предположение свелось к проверке относительного кросс частотного амплитудно-вариабельного кодирования эмоций в речевом сигнале.
Все полученные звуковые образцы (40 записей разной длины) были обработаны с помощью специально созданных программных средств, а усредненные значения предлагаемого параметра в исследованном частотном диапазоне (с шагом 50 Гц) были собраны в единый массив данных, который далее подвергся статистическому (факторному) анализу. Вращение и интерпретация полученных факторов проводились с помощью специально разработанных средств на основе сопоставления с известными для данных образцов (наборов слов «да» и «нет») оценками в четырехмерной модели эмоций.
В результате факторный анализ позволил оценить размерность и выявить 4 фактора (рис. 1), которые совокупно описывают 70,15% всей дисперсии данных.
Рис. 1. График распределения собственных значений при факторном анализе всего набора звуковых образцов, включая слова «да» и «нет» (всего 40 образцов). Стрелками отмечена граница, в соответствии с которой можно оценить размерность факторного пространства как равную четырем.
После специального вращения в пространстве модели эмоций для достижения наилучшего соответствия между нормированными значениями факторов и координатами образцов факторы получили спектральное выражение, показанное на рис. 2. Решение, полученное таким методом вращения, не сильно отличалось от решения, полученного методом варимакс с нормализацией. В результате полученные факторы можно охарактеризовать как бимодальные спектральные фильтры. Фактор 1 имеет основной максимум в области 3000 Гц и вспомогательный – 500 Гц. Фактор 2 имеет два близких максимума на частотах 1000 и 1750 Гц. Фактор 3 имеет самые широко разнесенные максимумы – в низкочастотной области (около 150 Гц) и высокочастотной области (3500 Гц). Фактор 4 имеет близкие максимумы на 600 и 1500 Гц и близок к фактору 2, но сдвинут относительно него в низкочастотную область, попадая своими максимумами в его локальные минимумы.
Рис. 2. Спектральные характеристики четырех выделенных факторов, которые описывают эмоциональные качества всех речевых образцов в совокупности. Горизонтальная ось дана в логарифмическом масштабе.В результате вычисления значения этих факторов и их нормализации (как этого требует теория кодирования и сферичность пространства психофизиологической модели) было проведено сопоставление оценок, полученных путем формального анализа звукового сигнала и субъективных оценок, в соответствии с моделью эмоций. Вычисленные коэффициенты корреляции для каждого набора в отдельности (слова «да» и «нет») и совместно представлены в таблицах 1-3.
Источник