Разработка алгоритмов и языковых моделей для мультиязычной системы автоматического аннотирования текстов разных жанров

Авторы

  • Ермоленко Татьяна Владимировна ФГБОУ ВО «Донецкий государственный университет» Автор
  • Бондаренко Виталий Иванович ФГБОУ ВО «Донецкий государственный университет» Автор
  • Пикалёв Ярослав Сергеевич ФГБОУ ВО «Донецкий государственный университет» Автор

Ключевые слова:

квазиреферат, Manifold Ranking, LSA, Transformer, seq2seq, BERT, GPT, BART

Аннотация

В статье приведено описание методов автоматического аннотирования текста: экстрактивного на основе Manifold Ranking и генеративных с использованием языковых моделей на базе архитектуры Transformer. Как показали численные исследования, качество аннотаций текстов художественного жанра, полученных с помощью квазиреферирования, сравнимо с аннотациями, сформированными современными языковыми моделями. По остальным жанрам наилучшее качество имеют аннотации, сгенерированные моделью GPT-3.

Загрузки

Опубликован

31.05.2023

Выпуск

Раздел

Информационные технологии и телекоммуникации

Как цитировать

[1]
2023. Разработка алгоритмов и языковых моделей для мультиязычной системы автоматического аннотирования текстов разных жанров. Вестник Донецкого университета. Серия 04. Технические науки. 2 (May 2023), 22–43.