Ученые используют нейросеть для изучения древнеславянского языка

Российские ученые создадут интерактивную базу древнеславянских текстов. Она поможет историкам и лингвистам углубить знания о современных славянских языках и открыть новые грани древней национальной культуры.

В проекте участвуют сотрудники Института русского языка им. Виноградова РАН, НИТУ "МИСиС", НИУ ВШЭ и научное сообщество при Епархиальном совете Москвы. С помощью искусственного интеллекта ученые планируют оцифровать и обработать несколько тысяч церковных рукописей на древнерусском, болгарском и сербском языком. Глубокий анализ позволит отследить изменения, происходившие в языке и культуре на протяжении нескольких веков. Без участия нейросетей такая работа могла бы занять годы, а учитывая специфику изучаемого предмета и нехватку специалистов в этой области — возможно, даже столетия.

Перед разработчиками программы в данном случае стоит две больших задачи. Первая — преобразование сканированных изображений в формат, совместимый с алгоритмом работы ИИ. Второй — построение языковой модели, способной воспринимать и анализировать старославянские тексты. В НИТУ "МИСиС", отвечающем за техническую сторону проекта, отмечают, что подобных платформ ранее не создавалось.

Первый текст, который будет размечен и оцифрован искусственным интеллектом — комплекс древнеславянских миней XI-XVII веков на древнерусском, болгарском и сербском языках. Минеи — богослужебные книги, содержащие распорядок церковных праздников, богослужений, прославления святых. Это уникальный памятник языковой культуры, содержащий важную информацию об архаичных графико-орфографических и языковых особенностях. Сопоставление рукописей различного происхождения и их подробный анализ позволят ученым обогатить имеющиеся знания о трансформации славянских языков и культуры на протяжении нескольких столетий.
Источник: https://ria.ru/20200318/1568763971.html

Задать вопрос

Заполните форму, и наши эксперты ответят вам

Свяжитесь с нами

+7 (499) 754-07-77
info@center2m.ru
107045, Москва, Просвирин пер., д.4