Методы проектирования архитектуры модели интеллектуального ассистента для образовательной организации

Авторы

  • Елисеев Вадим Олегович ФГБНУ «Институт прикладной математики и механики» Автор
  • Бондаренко Виталий Иванович ФГБОУ ВО «Донецкий государственный университет» Автор

DOI:

https://doi.org/10.5281/zenodo.14514613

Ключевые слова:

генерация текста, LLM, GPT, точная настройка, fine-tuning, чат-бот

Аннотация

Большинство наиболее успешных больших генеративных языковых моделей (LLM) состоят из трех составных частей: кодировщика, декодера и механизма внимания. В статье были рассмотрены основные подходы к проектированию каждой из этих частей, а также наиболее популярные архитектуры LLM. Кроме того, был проведен сравнительный анализ методов обучения и применения больших генеративных языковых моделей на предмет оптимальности в использовании для построения интеллектуального ассистента образовательной организации. Результаты исследования показали, что при имеющихся ресурсах наиболее подходящим способом является точная настройка существующей LLM на текстовом корпусе данных об образовательной организации с последующим ее использованием напрямую либо посредством механизма RAG.

Загрузки

Опубликован

03.12.2024

Выпуск

Раздел

Информационные технологии и телекоммуникации

Как цитировать

[1]
2024. Методы проектирования архитектуры модели интеллектуального ассистента для образовательной организации. Вестник Донецкого университета. Серия 04. Технические науки. 4 (Dec. 2024), 87–100. DOI:https://doi.org/10.5281/zenodo.14514613.