Искусственный интеллект может понимать юмор, но только в виде отдельных слов. К такому выводу пришла группа ученых из США и Великобритании, устроивших ИИ проверку на чувство юмора. Исследователи хотели проверить, сможет ли компьютерный алгоритм самостоятельно выделять из массива слов смешные выражения и давать им оценку.
Над экспериментном работали ученые из Оксфордского университета, сотрудники Microsoft Research и стартапа TRASH. В качестве испытуемого выступал алгоритм word2vec. Для анализа ему предложили массив слов, состаящий из 4997 лингвистических единиц определенной степени забавности. Слова отбирались по определенным принципам, которые при желании можно было бы назвать универсальным рецептом юмора: каждое слово должно забавно звучать, сталкивать в себе противоположные понятия и отсылать к ругательствам или сексу.
Степень того, насколько смешным кажется то или иное слово, определяла фокус-группа, выставляя оценку от 1 до 5. Затем в дело вступал искусственный интеллект: он самостоятельно оценивал слово и определял, насколько его забавность коррелирует со средней оценкой опрошенных людей.
Следующим этапом стала попытка научить алгоритм самостоятельно выбирать из массива слов смешные выражения. Для этого ученые предложили word2vec массив данных из 120 тысяч слов. На этот раз фокус-группа из 1700 человек должна была выбрать из 6 различных слов самое смешное. В топ-200 наиболее забавных выражений вошло, например, слово whakapapa (слово маорийского происхождения, обозначающее перечень предков), boobies (название птиц олушей), schmaltzy (прилагательное, обозначающее чересчур сентиментального человека).
Искусственному интеллекту предложили сравнить оценки людей с базовыми характеристиками, определяющими слово как смешное. Алгоритм успешно справился с этой задачей: опираясь на уже имеющиеся паттерны, он определил, какие выражения насмешили бы мужчин, женщин, детей или стариков.
Единственное, что стало для искусственного интеллекта непосильной задачей – способность оценить юмор, заключающийся в более сложной конструкции. Например, предложение с сатирическим подтекстом по-прежнему способно поставить алгоритм в тупик. И именна эта трудность, по мнению ученых, может стать отправной точкой в дальнейших исследованиях.
Источник: https://chrdk.ru/news/funny-or-not