Новый алгоритм помогает туристам находить интересные направления для поездок
Защитивший докторскую диссертацию в Таллиннском технологическом университете Аго Луберг разработал алгоритм, который помогает тем, кто любит искать интересные места и достопримечательности для путешествий через интернет, быстрее их находить.
Чтобы ориентироваться в море информации в интернете все чаще используются рекомендации, основанные на автоматизированных системах. То же самое делается в сфере туризма и планирования путешествий. Однако в большинстве случаев используемые здесь системы рекомендаций сосредоточены на коммерческих аспектах, таких как предложение дешевых отелей, ресторанов, проездных билетов и т.д.
Луберг в своей работе обратил внимание на более захватывающие и интересные для человеческого глаза места. При этом он основывался на данных, созданных самими людьми. "Тысячи туристов по всему миру создали общее представление о том, что важно для людей. Если при каких-то рекомендациях основываются на мнении эксперта, то для нас эксперт - обычный человек", - отметил Луберг.
Основной упор в работе был сделан на сбор и обработку данных по туристическим объектам. В рамках своей работы Луберг принимал участие в проектировании и разработке различных систем рекомендаций, таких как Sightsplanner, Sightsmap и системе рекомендаций веб-сайта Visit Estonia, а также в сборе, обработке и интеграции данных для них. Это позволило изучить способы устранения так называемых недостатков различных автоматизированных систем, что позволило бы создавать более совершенные системы, чем раньше.
По словам Луберга, автором первоначальной идеи во многом был научный руководитель докторской диссертации Танель Таммет. "Здесь можно использовать личный опыт. Долгое время следование рекомендациям советников по туризму показало, что никто из них не предложил нам то, что мы действительно хотели получить. Поэтому мы начали решать проблему, как создать так называемого советчика, который учитывал бы отзывы туристов, то есть сообщения пользователей", - отметил свежеиспеченный доктор наук.
В разных системах учитываются разные аспекты. Например, обилие фотографий, сделанных в некоторых местах, показывает визуальную привлекательность этих мест. Количество посещений страниц Википедии показывает, насколько хорошо они известны и такие системы как Foursquare/Swarm показывают фактическое количество посещений этих мест. Луберг и Таммет особенно интересовались выявлением повторяющихся объектов в базах данных.
Практические результаты
Одним из важных результатов работы Аго Луберга с коллегами было то, как вероятностную и нечеткую логику можно применить к расчету подходящих цен для туристических объектов используя для этого неопределенные категории, онтологии и основанных на доказательствах алгоритмы. За основу были взяты имеющиеся данные о туристических достопримечательностях и просто предпочтения пользователей.
Во-вторых, разработали основанную на методах машинного обучения систему, которая может идентифицировать записи, описывающие одни и те же реальные объекты, но из разных источников данных. Например, созданный алгоритм при анализе данных таллиннских мест общепита и достопримечательностей в Риге, в том числе музеев, художественных галерей и т. д. показал точность 98%. Для сравнения, точность при заданных вручную параметрах была намного ниже - 85%.
Луберг отметил, что системы рекомендаций в той или иной стране создавались и ранее. Однако вместе с Тамметом они поставили цель, чтобы их результаты были применимы во всем мире. "В целом информацию о туристических достопримечательностях Таллина или Риги найти легко, но если вы хотите сделать что-то, что автоматически охватило бы большую часть мира, вы должны думать масштабнее. Итак, у нас был критерий, согласно которому данные должны быть глобальными. Таких баз данных, которые были бы доступны и покрывали бы большие территории, не очень много", - отметил Луберг.
В-третьих, Луберг создал алгоритм, определяющий название и категорию туристических достопримечательностей. Алгоритм был основан на вводимых пользователем описаниях объектов, и на основе полученных данных можно было интегрировать данные из разных источников данных. Например, при использовании подписей изображений с сайта Panoramio алгоритм смог найти около 56% туристических достопримечательностей, описания которых есть в британской и французской версиях Википедии.
"Меня больше всего впечатлило то что, когда, помимо поиска популярных мест в мире по изображениям, мы смогли идентифицировать типы и названия объектов по названиям изображений. Было интересно наблюдать за тем, как многие писали что-то вроде "я и Башня", но подписи под большинством фотографий все же содержали настоящее название объект", - сказал Луберг. По его мнению, это действительно показывает, что люди могут вместе делать очень хорошие дела.
Полностью докторскую диссертацию в электронном виде можно прочитать на сайте Таллиннского технологического университета. Работой руководил профессор Танель Таммет.
Редактор: Надежда Берсенёва