Под '''
== Процедура ==
«Поисковая дополненная генерация» по существу состоит из четырех этапов:
# Индексирование данных
# Получение данных
# Аугментация
# Генерация ответа
=== Индексирование данных ===
На первом этапе данные, на которые делается ссылка, преобразуются в векторные представления слов и индексируются в векторной базе данных. Данные могут быть неструктурированными (текст, изображения, видео, аудио), полуструктурированными или структурированными (например, из реляционной базы данных или графа знаний). В векторной базе данных встраивания слов связаны с исходными данными.
В зависимости от соответствующей реализации поисковые запросы к системе и связанные с ними ответы также могут индексироваться системой RAG.
=== Получение данных ===
Во время извлечения данных поисковый запрос пользователя сначала преобразуется в встраивание слова. Затем определяется, какие данные, хранящиеся в векторной базе данных, соответствуют запросу пользователя. Если релевантные данные найдены, они взвешиваются ( ''
Для расчета корреляции можно использовать разные методы. Использование Okapi BM25.
является типичным.
Данные могут быть отфильтрованы по разным причинам. Важно учитывать конфиденциальность данных, ограничения защиты детей, авторские права и тому подобное.
=== Аугментация ===
В процессе расширения данные, специфичные для приложения, такие как системное приглашение и метаданные пользователя, а также данные, найденные в поисковом запросе, объединяются с запросом пользователя. Сложные системы RAG могут интегрируйте запрос пользователя в различные области знаний, разделяйте и обрабатывайте конкретно.
=== Генерация ответа ===
На последнем этапе расширенный поисковый запрос передается в языковую модель, которая преобразует данные в ответ с помощью статистической модели..
Кроме того, ответ, сгенерированный языковой моделью, связан со ссылками на источники данных (обычно через универсальный идентификатор ресурса | URI), чтобы пользователь мог понять и контролировать ответ.
== Проблемы ==
Системы RAG очень сложны в реализации из-за большого количества задействованных программных систем и участников.
Кроме того, индексирование, взвешивание и фильтрация данных должны постоянно адаптироваться и расширяться с учетом постоянно меняющихся обстоятельств. Таким образом, эксплуатация системы RAG связана не только с большими усилиями по внедрению, но и с непрерывными усилиями в эксплуатации.
== Ссылки ==
Категория:Искусственный интеллект
Подробнее: https://de.wikipedia.org/wiki/Retrieval ... Generation
Поисковая расширенная генерация ⇐ Васина Википедия
-
Автор темыwiki_de
- Всего сообщений: 48480
- Зарегистрирован: 13.01.2023
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
Мобильная версия