Разработка алгоритмов и языковых моделей для мультиязычной системы автоматического аннотирования текстов разных жанров
Ключевые слова:
квазиреферат, Manifold Ranking, LSA, Transformer, seq2seq, BERT, GPT, BARTАннотация
В статье приведено описание методов автоматического аннотирования текста: экстрактивного на основе Manifold Ranking и генеративных с использованием языковых моделей на базе архитектуры Transformer. Как показали численные исследования, качество аннотаций текстов художественного жанра, полученных с помощью квазиреферирования, сравнимо с аннотациями, сформированными современными языковыми моделями. По остальным жанрам наилучшее качество имеют аннотации, сгенерированные моделью GPT-3.
Загрузки
Опубликован
Выпуск
Раздел
Лицензия

Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial» («Атрибуция — Некоммерческое использование») 4.0 Всемирная.
Статьи журнала «Вестник Донецкого университета. Серия 04. Технические науки» находятся в открытом доступе и распространяются в соответствии с условиями Лицензионного Договора с Донецким Государственным университетом, который бесплатно предоставляет авторам неограниченное распространение и самостоятельное архивирование.





