ИИ легче освоить язык, на котором говорит немного людей

Немецкие исследователи изучили, насколько легко алгоритмы искусственного интеллекта учатся использовать различные человеческие языки. Оказалось, что ИИ легче выучить языки с меньшим количеством носителей и труднее – те, на которых говорят много людей. Этот результат, казалось бы, прямо противоречит современному представлению о связи между количеством носителей и сложностью освоения языка.
Многих до сих пор поражает, насколько хорошо современный искусственный интеллект может писать на человеческом языке: порой не сразу понимаешь, что автором текста на самом деле является алгоритм.
Флександр Коплениг и Саша Вольфер из Института немецкого языка и литературы имени Лейбница в Мангейме заставили ИИ выучить около двух тысяч языков мира.
ИИ осваивают языки на основе больших массивов текста, в которых они ищут и находят закономерности. Так называемые интеллекты-трансформеры, например, известный ChatGPT, все лучше предсказывают, как будет развиваться текст, начиная с определенной точки.
Эксперимент показал, что разные языки требуют разного объема исходного текста для достижения приемлемого уровня компетенции, причем чем больше у этого языка носителей, тем больше исходного текста требуется.
Корреляция между количеством говорящих и объемом учебного текста сохранялась даже тогда, когда исследователи устраняли влияние посторонних факторов, таких как межъязыковое родство или общее географическое положение носителей, а также различия, связанные с качеством материала.
Почему так происходит, ученые не знают. До сих пор среди лингвистов преобладали две совершенно разные точки зрения.
Согласно одной из них, все языки на самом деле имеют более или менее одинаковую сложность.
Согласно другой теории, языки с большой численностью носителей со временем становятся проще, поскольку в силу международного использования этих языков их часто изучают взрослые, для которых освоение сложных грамматических конструкций может оказаться более трудным, чем для детей.
Результат, полученный в исследовании, совершенно неожиданно противоречит обоим этим теориям.
Возможное объяснение может заключаться в том, что изучение языка для ИИ – это все же нечто совершенно иное, чем изучение языка для человека.
Более подробно о результатах можно прочитать в журнале Scientific Reports.
Редактор: Софья Люттер
Источник: Novaator