Люди все хуже отличают настоящую речь от сгенерированной
В интернете появляется все больше видео- и аудиороликов, главные герои которых — сгенерированные искусственным интеллектом люди. И если особенности их внешности и мимики пока еще недостаточно достоверны, то человеческую речь искусственный интеллект имитирует все лучше.
В недавнем исследовании британские ученые обнаружили, что люди могут отличить созданную искусственным интеллектом речь от подлинной только в 73 процентах случаев. Причем, этот показатель примерно одинаков как для носителей английского, так и для говорящих на китайском языке испытуемых.
Кимберли Мэй и ее коллеги из Университетского колледжа Лондона получили такой результат, когда воспроизвели участникам исследования предложения на их родном языке, некоторые из которых были произнесены реальным человеком, а другие — компьютерной программой на основе искусственного интеллекта.
Если разные предложения произносились попеременно разными голосами, то люди чаще испытывали затруднения в опознании человеческой речи. Результат был немного лучше, когда одно и то же выражение произносил сперва человек, а затем искусственный интеллект.
В реальной же жизни, при просмотре видеороликов или во время телефонного разговора, у людей едва ли будет возможность сравнить машинный голос с настоящим. Поэтому такая низкая чувствительность к подделкам сильно беспокоит ученых. Кимберли Мэй и ее коллеги обучили испытуемых некоторым методам распознавания фальшивой речи, но это не существенно повлияло на их результаты. Более того, надежных результатов не дают даже автоматические детекторы.
Исследование опубликовано в Plos One.
Редактор: Юлия Тислер