Минутная лекция: как искусственный интеллект может помочь гуманитариям?
Искусственный интеллект позволяет каждому получать практическую пользу от чат-ботов, а также может использоваться в автоматизации научной работы. Исследователь Таллиннского университета по анализу культурных данных Андрес Карьюс в своей минутной лекции объясняет, как ИИ может помочь гуманитариям.
В гуманитарных науках наступили увлекательные времена, и это связано с тем, что существует множество приложений и применений искусственного интеллекта. Вероятно, все уже знакомы с различными чат- и текстовыми ботами роботами, такими как ChatGPT или Copilot. Эти инструменты полезны в качестве помощников при написании, а также обобщении и перефразировании текстов. Но исследователям-гуманитариям гораздо интереснее сами большие языковые модели, на базе которых работают чат-боты.
Речь идет о моделях машинного обучения, с помощью которых можно с минимальными усилиями автоматизировать различные крупномасштабные аналитические задачи. Ранее это можно было делать через контролируемое (supervised) машинное обучение, но при этом приходилось настраивать или обучать отдельную модель для каждой переменной, вопроса или гипотезы. Это, в свою очередь, требовало больших объемов размеченных человеком обучающих данных.
Автоматизированный анализ или классификация данных с использованием больших языковых моделей значительно упрощены, поскольку их можно просто инструктировать — предоставлять указания, основанные на экспертных знаниях ученого, и примеры, а затем последовательно "задавать вопросы" по каждому элементу данных и признаку, пока весь объем не будет проанализирован. Как уже показано в нескольких научных статьях, в ряде случаев это работает довольно хорошо.
Так что стоит задуматься, какие задачи, которые раньше выполнялись самостоятельно или поручались студентам и научным сотрудникам, теперь можно делегировать искусственному интеллекту. В этом случае нужно просто быть немного осторожнее: учитывать возможные предвзятости модели; проверять, хорошо ли она работает с конкретной задачей и языком, а также проверять точность прогнозов или процент ошибок при дальнейшем статистическом моделировании полученных объемов данных.
Таким образом, теперь в принципе возможно проводить исследования с большими объемами данных, которые ранее выполнялись на меньшем масштабе — потенциал здесь значительный.
Редактор: Юлия Тислер