Definicja
Generowanie rozszerzone o wyszukiwanie (RAG) to technika łącząca modele generatywne z systemami wyszukiwania informacji. Ugruntowuje ona wyniki w źródłach zewnętrznych w celu zwiększenia dokładności faktów.
Cel
Celem jest redukcja halucynacji w generatywnej sztucznej inteligencji poprzez wzbogacenie odpowiedzi o pobrane dokumenty. Jest to szczególnie przydatne w przypadku odpowiadania na pytania i zadań wymagających dużej wiedzy.
Znaczenie
- Poprawia dokładność faktograficzną wyników LLM.
- Umożliwia integrację wiedzy specyficznej dla danej dziedziny.
- Wymaga niezawodnych systemów wyszukiwania.
- Związane z hybrydowym wyszukiwaniem i zapewnianiem jakości w domenie otwartej.
Jak to działa
- Użytkownik podaje zapytanie lub monit.
- System wyszukiwania pobiera odpowiednie dokumenty.
- Dokumenty są przekazywane do modelu generatywnego.
- Model generuje odpowiedzi bazujące na pobranej treści.
- Pętle sprzężenia zwrotnego poprawiają wydajność w przyszłości.
Przykłady (świat rzeczywisty)
- OpenAI ChatGPT z wtyczkami do przeglądania i pobierania.
- Model Meta RAG: badania nad modelami LLM opartymi na odzyskiwaniu informacji.
- Perplexity AI: wyszukiwanie konwersacyjne wspomagane wyszukiwaniem.
Odniesienia / Dalsza lektura
- Lewis i in. „Generacja wspomagana wyszukiwaniem dla przetwarzania języka naturalnego opartego na wiedzy”. NeurIPS 2020.
- Implementacja RAG Hugging Face.
- Badania HAI na Uniwersytecie Stanforda nad metodami wyszukiwania.
- Czym jest RAFT? RAG + Fine-Tuning