Лингвист из Кембриджа: как по запинкам в речи определить преступника
Нарушения плавности речи, такие как заполненные и молчаливые паузы, повторы, самоперебивания и растягивание звуков, часто встречаются у людей с заиканием, в таком случае используют английский термин dysfluency. Однако подобные запинки могут наблюдаться и в нормальной речи – тогда говорят о disfluency. По словам доцента фонетики в секции теоретической и прикладной лингвистики Кембриджского университета Кирсти Макдугалл, эти особенности очень индивидуальны, и потому их можно использовать даже для поимки преступников.
По оценке Макдугалл, представившей результаты своей работы на недавно прошедшем в Тарту Международном симпозиуме по прикладной фонетике, исследователи до сих пор уделяли мало внимания изучению запинок (или дисфлюэнций) в нормальной речи. Однако такие явления как заполненные и молчаливые паузы, повторы, растягивание звуков или самоперебивания характерны для большинства людей и могут являться частью процесса планирования высказывания. По мнению исследователя, они могут быть обусловлены психо- или социолингвистическими факторами и, как правило, не контролируются сознательно. Все это предполагает высокую вероятность индивидуальных различий.
Изучение "нормальных" запинок позволяет улучшать модели производства и развития речи, а также технологии по ее распознаванию и синтезу. Кроме того, эти знания могут быть полезны в обучении языкам, тестировании и логопедии. "Обычно учителя не преподают стратегии выражения сомнений, хотя практика использования пауз, заполнений и повторов может улучшить владение языком и помочь справиться с планированием речи", – говорит Макдугалл. Для терапевтов исследования запинок могут дать лучшее понимание того, что является нормой, а что нет.
Наконец, эти знания могут применяться в судебной фонетике. "Имеются в виду случаи, в которых есть записанная речь, например, требования выкупа, анонимные сообщения в экстренные службы, угрозы, шантаж и преследования. У полиции может быть запись звонка и интервью с подозреваемым. Задача судебного фонетиста — сравнить их и решить, это речь одного и того же человека или нет", – объясняет Макдугалл.
Большой потенциал в судебном производстве
Хотя может показаться, будто главный признак, на который должны обращать внимание в такой экспертизе, это голос, на самом деле в фокусе таких исследований другие переменные. По словам лингвиста, голос может сильно меняться у одного и того же человека. "Голоса – это не отпечатки пальцев и не ДНК, – говорит Макдугалл. – В настоящее время нет 100% надежной технологии для идентификации голоса".
По ее словам, существующие исследования в основном сосредотачивались на особенностях произношения, которые можно объяснить анатомическими характеристиками. Изучалась, например, частота основного тона, связанная с длиной и массой голосовых связок, и форманты, коррелирующие с размерами и формой речевого тракта. Исследование различных запинок фокусируется на совершенно другом аспекте речевой деятельности: поведенческом, а не анатомическом.
По словам Макдугалл, дисфлюэнции хорошо сохраняются в условиях плохой записи, когда присутствуют фоновый шум или телефонные помехи. Признаки, связанные с анатомией, сложнее выявить в случае некачественного звука.
Для исследования запинок в судебной практике необходимо было разработать метод их квантификации (то есть измерения качественных показателей в количественных величинах). Используя базу данных DyVis, Макдугалл вместе с лингвистом Мартином Даквортом создали "Таксономию признаков плавности речи для судебного анализа" – TOFFA.
В базе данных DyVis были собраны записи речи тысячи молодых мужчин (18–25 лет), говорящих на стандартном южнобританском английском. В особенности исследователей интересовали интервью в полицейском участке.
Ученые отмечали все возможные проявления дисфлюэний в записанной речи: заполненные (такие как "эээ", "гм" и так далее) и незаполненные (молчание, длящееся больше 200 мс) паузы, повторы (целых фраз, слов или отдельных слогов), растягивание звуков и самоперебивания (когда человек начинает одно слово или фразу, но не договаривает, и переходит к другой).
Затем записи кодировали и квантифицировали: подсчитывали количество запинок, возникающих на каждые 100 слогов и на каждые 20 секунд.
Индивидуальность в запинках
Используя собранный материал и разработанную методику, Макдугал и ее коллеги провели несколько исследований. Для начала они хотели ответить на вопрос, насколько дисфлюэнции индивидуальны и могут ли особенности запинок охарактеризовать говорящего в судебных делах. Для этого они использовали выборку, состоящую из 20 мужчин из базы данных DyVis.
Выяснилось, что в среднем участники исследования запинались 25 раз на 100 слогов, хотя количество дисфлюэнций значительно варьировалось от участника к участнику. Сравнивая говорящих с похожей частотой запинок, ученые обнаружили, что у каждого из них был свой "профиль": кто-то чаще использовал заполненные паузы, кто-то – молчание, один растягивал звуки, другой повторял слова.
Затем ученые использовали статистический анализ, чтобы проверить, можно ли только с помощью данных о запинках определить говорящего. Выяснилось, что комбинация разных типов дисфлюэнций давала возможность вычислить "подозреваемого" с 32,5% точностью.
В другой работе исследователи хотели узнать, прослеживаются ли индивидуальные особенности дисфлюэнций в разных акцентах. "Если мы разбираем судебный случай в Ливерпуле, можем ли мы использовать полученные знания на примере южно-британского английского, или нам необходимо изучать ливерпульский диалект отдельно?" – поясняет Макдугалл. Для этого исследователи сравнили выборку из базы данных DyVis c аналогичными записями 17 молодых людей из корпуса YorVis, говорящих на йоркширском (северном) варианте английского.
Кроме того, ученых интересовало, сохраняется ли характер запинок в разных речевых ситуациях. Для ответа на этот вопрос они сравнивали интервью полиции с записью телефонного звонка.
В целом ученые обнаружили, что во время звонков речь людей менее плавная. При этом количество дисфлюэнций у одного и того же человека коррелировало в разных ситуациях. "Как правило, если человек чаще других запинался в интервью, у него было также больше среднего дисфлюэнций в звонке", – поясняет Макдугалл. Более того, большинство людей сохраняло профиль запинок в интервью и звонке. Например, некоторые участники почти не использовали повторы, а другие повторялись одинаково во всех речевых ситуациях.
Дискриминационный анализ позволил выявить говорящего с похожей степенью точности (31,7–37,2%) как в интервью, так и в телефонном звонке, как среди говорящих на южном, так и на северном варианте английского.
По словам Макдугалл, между акцентами все же были обнаружены статистически значимые различия, поэтому она считает, что необходимо провести дополнительные исследования, захватив большую выборку с разными типами произношения.
Шаг вперед
Ученая отмечает, что TOFFA позволяет квантифицировать наблюдения, которые раньше можно было объяснить лишь внутренним чутьем следователя. Метод выявляет признаки, которые не всегда удается заметить, и тем более, внести в протокол.
"Я определенно не утверждаю что такой тип анализа можно считать достаточным основанием, чтобы посадить человека за решетку, однако он точно дает дополнительную информацию, которую можно использовать в разборе судебных дел, комбинируя ее с другими данными", – говорит Кирсти Макдугалл.
В качестве конкретного примера она приводит случай с двумя братьями с очень похожими голосами, произношением и анатомическими характеристиками. "Мы обнаружили, что единственной чертой, по которой их можно было дифференцировать, был характер дисфлюэнций. У одного было 12 запинок в минуту, у другого – 44. Профиль дисфлюэнций также был разный".
В ближайшее время ученые планируют заняться сбором данных разных групп населения, проанализировать выборку с австралийским вариантом английского и изучить запинки в структуре разговора.
"Это большой шаг вперед, по сравнению с тем, что есть в арсенале судебной практики сейчас, однако нам необходимо провести больше исследований, чтобы наши данные можно было распространить на более широкую популяцию", – подытоживает Макдугалл.
Кирсти Макдугалл выступила с пленарным докладом "Analysis of disfluency behaviour for forensic phonetic applications" на Международном симпозиуме по прикладной фонетике ISAPh-2024 в Тарту 1 октября 2024 года.