Rozwiązywanie problemów jest jedną z wrodzonych zdolności człowieka. Od naszych prymitywnych dni, kiedy nasze największe wyzwania w życiu nie polegały na tym, aby dać się zjeść drapieżnemu zwierzęciu, aż do czasów współczesnych, kiedy trzeba było szybko dostarczyć coś do domu, łączyliśmy naszą kreatywność, logiczne rozumowanie i inteligencję, aby znaleźć rozwiązania konfliktów.
Teraz, gdy jesteśmy świadkami genezy inteligentnych AI, stajemy w obliczu nowych wyzwań w odniesieniu do ich zdolności podejmowania decyzji. Podczas gdy poprzednia dekada była poświęcona świętowaniu możliwości i potencjału modeli i zastosowań AI, ta dekada jest poświęcona pójściu o krok dalej – kwestionowaniu zasadności decyzji podejmowanych przez takie modele i wywnioskowaniu ich uzasadnienia.
Wraz ze wzrostem znaczenia wyjaśnialnej sztucznej inteligencji (XAI) nadszedł czas na omówienie kluczowej koncepcji w opracowywaniu modeli AI, którą nazywamy Łańcuch myśliW tym artykule dokładnie rozszyfrujemy i zdemistyfikujemy, co to oznacza i jakie są proste terminy.
Czym jest podpowiadanie łańcucha myśli?
Gdy umysł ludzki jest gotowy na wyzwanie lub złożony problem, naturalnie próbuje rozbić go na fragmenty mniejszych, sekwencyjnych kroków. Kierowany logiką, umysł ustanawia połączenia i symuluje scenariusze przyczynowo-skutkowe, aby opracować strategię najlepszego możliwego rozwiązania wyzwania.
Proces powielania tego w modelu lub systemie sztucznej inteligencji jest Podpowiadanie łańcucha myśli.
Jak sama nazwa wskazuje, model AI generuje serię lub łańcuch logicznych myśli (lub kroków), aby podejść do zapytania lub konfliktu. Wyobraź sobie to jako udzielanie instrukcji zakręt po zakręcie komuś proszącemu o trasę do celu.
Jest to dominująca technika stosowana w modelach rozumowania OpenAI. Ponieważ są one zaprojektowane tak, aby myśleć, zanim wygenerują odpowiedź lub odpowiedź, były w stanie zdać egzaminy konkursowe, zdawane przez ludzi.
[Przeczytaj także: Wszystko, co musisz wiedzieć o LLM]
Korzyści z podpowiadania na podstawie łańcucha myśli
Wszystko, co jest oparte na logice, daje znaczną przewagę. Podobnie, modele trenowane na podstawie łańcucha myśli zachęcającego oferują nie tylko dokładność i trafność, ale także różnorodne korzyści, w tym:
Ulepszone rozwiązanie problemu możliwości, gdzie ich znaczenie jest krytyczne w takich dziedzinach jak opieka zdrowotna i finanse. LLM-y, które wdrażają łańcuch myśli, zachęcając do lepszego zrozumienia jawnych i ukrytych wyzwań i generują odpowiedzi po rozważeniu odrębnych prawdopodobieństw i najgorszych scenariuszy.
Łagodzące Założenia oraz wyniki wygenerowane na podstawie założeń, ponieważ modele stosują logiczne i sekwencyjne myślenie i przetwarzanie w celu wyciągnięcia wniosków, zamiast wyciągać je od razu.
Bardziej wszechstronność ponieważ modeli nie trzeba rygorystycznie trenować w oparciu o nowy przypadek użycia, ponieważ działają one zgodnie z logiką, a nie celem.
Zoptymalizowana Spójność w zadaniach obejmujących odpowiedzi złożone z wielu części.
Anatomia działania techniki podpowiadania myśli
Jeśli znasz monolityczną architekturę oprogramowania, wiesz, że cała aplikacja oprogramowania jest rozwijana jako pojedyncza spójna jednostka. Uproszczenie tak złożonego podatku nastąpiło wraz z metodą architektury mikrousług, która obejmowała rozbicie oprogramowania na niezależne usługi. Spowodowało to szybszy rozwój produktów i bezproblemową funkcjonalność.
Podpowiedzi CoT w AI jest podobny, gdzie LLM są prowadzeni przez serię sekwencyjnych procesów rozumowania w celu wygenerowania odpowiedzi. Odbywa się to poprzez:
- Instrukcje jawne, w których modele otrzymują bezpośrednie instrukcje, jak podejść do problemu sekwencyjnie, za pomocą prostych poleceń.
- Niejawne instrukcje są bardziej subtelne i niuansowane w swoim podejściu. W tym przypadku model jest przeprowadzany przez logikę podobnego zadania i wykorzystuje jego zdolności wnioskowania i rozumienia, aby odtworzyć logikę dla przedstawionych problemów.
- Przykłady demonstracyjne, w których model przedstawiałby rozumowanie krok po kroku i generowałby przyrostowe spostrzeżenia umożliwiające rozwiązanie problemu.
3 rzeczywiste przypadki, w których zastosowano podpowiedzi CoT
Modele decyzji finansowych | Multimodalny CoT w botach | Służba Zdrowia |
|---|---|---|
| W tym niezwykle niestabilnym sektorze podpowiedzi CoT można wykorzystać do zrozumienia potencjalnej trajektorii finansowej firmy, przeprowadzania oceny ryzyka dla osób poszukujących kredytu i nie tylko | Chatboty, które są opracowywane i wdrażane dla przedsiębiorstw, wymagają niszowych funkcjonalności. Muszą wykazać się umiejętnościami rozumienia różnych formatów danych wejściowych. Podpowiedzi CoT działają najlepiej w takich przypadkach, gdy boty muszą łączyć podpowiedzi tekstowe i graficzne, aby generować odpowiedzi na zapytania. | Od diagnozowania pacjentów na podstawie danych opieki zdrowotnej po generowanie spersonalizowanych planów leczenia dla pacjentów, podpowiedzi CoT mogą uzupełniać cele opieki zdrowotnej klinik i szpitali. |
Przykład
Zapytanie klienta: Zauważyłem transakcję na moim koncie, której nie rozpoznaję, moja karta debetowa została zgubiona i chcę skonfigurować alerty dotyczące transakcji na moim koncie. Czy możesz mi pomóc w tych kwestiach?
Krok 1: Zidentyfikuj i sklasyfikuj problemy
- Nierozpoznana transakcja.
- Zgubiona karta debetowa.
- Konfigurowanie alertów transakcyjnych.
Krok 2: Zajmij się nierozpoznaną transakcją
Zapytaj o szczegóły: Czy możesz podać datę i kwotę transakcji?
- Oddział 1: Jeśli podano szczegóły:
- Przejrzyj transakcję. Jeśli jest oszukańcza, zapytaj, czy klient chce ją zakwestionować.
- Oddział 2: Jeśli nie podano szczegółów:
- Zaoferuj dostarczenie listy ostatnich transakcji.
Krok 3: Zaadresuj zgubioną kartę debetową
Zamroź kartę: Zalecamy natychmiastowe zamrożenie.
- Oddział 1: Jeżeli klient wyraża zgodę:
- Zamroź kartę i zapytaj, czy chcą wymianę. Potwierdź adres wysyłki.
- Oddział 2: Jeżeli klient odmówi:
- Zalecamy monitorowanie konta pod kątem nieautoryzowanych transakcji.
Krok 4: Skonfiguruj alerty transakcji
Wybierz metodę alertu: SMS, e-mail czy oba?
- Oddział 1: Jeśli klient wybierze:
- Ustaw alerty dla transakcji powyżej określonej kwoty. Poproś o kwotę.
- Oddział 2: Jeśli nie jesteś pewien:
- Zaproponuj domyślną kwotę (np. 50 USD) i potwierdź.
Krok 5: Podaj podsumowanie i kolejne kroki
- Badanie nierozpoznanej transakcji.
- Zamrożenie karty debetowej i ewentualne wydanie nowej.
- Konfigurowanie alertów transakcyjnych zgodnie z żądaniem.
Racjonalne uzasadnienie:
Proces ten pozwala na efektywną obsługę wielu zapytań klientów dzięki jasnym krokom i gałęziom decyzji, gwarantując kompleksowe rozwiązania.
Ograniczenia podpowiedzi CoT
Łańcuch myśli jest rzeczywiście skuteczny, ale zależy również od przypadku użycia, do którego jest stosowany, i kilku innych czynników. Istnieją szczególne wyzwania związane z Monit CoT w AI które uniemożliwiają interesariuszom pełne wykorzystanie jego potencjału. Przyjrzyjmy się typowym wąskim gardłom:
Zbytnie komplikowanie prostych zadań
Podczas gdy podpowiedzi CoT najlepiej sprawdzają się w przypadku złożonych zadań, mogą komplikować proste zadania i generować błędne odpowiedzi. W przypadku zadań, które nie wymagają rozumowania, najlepiej sprawdzają się modele odpowiedzi bezpośrednich.
Zwiększone obciążenie obliczeniowe
Przetwarzanie podpowiedzi CoT wymaga znacznego obciążenia obliczeniowego i jeśli technika ta jest wdrażana w mniejszych modelach, które są zbudowane z ograniczonymi możliwościami przetwarzania, może je przytłoczyć. Konsekwencje takich wdrożeń mogą obejmować wolniejsze czasy reakcji, słabą wydajność, niespójność i inne.
Jakość inżynierii szybkiego reagowania AI
Podpowiedzi CoT w AI działa w oparciu o założenie (lub zasadę), że konkretny monit jest dobrze sformułowany, ustrukturyzowany i jasny. Jeśli monitowi brakuje tych czynników, podpowiedzi CoT tracą zdolność do uchwycenia wymogu, co skutkuje generowaniem nieistotnych kolejnych kroków i ostatecznie odpowiedzi.
[Przeczytaj także: Czym są małe modele językowe? Przykłady ze świata rzeczywistego i dane treningowe]
Zredukowane możliwości skalowalne
Interesariusze mogą doświadczyć problemów ze swoimi modelami, jeśli muszą wykorzystać podpowiedzi łańcucha myśli dla ogromnych wolumenów zestawów danych lub złożoności problemów. W przypadku zadań obejmujących większe kroki rozumowania technika ta może spowolnić czas reakcji, czyniąc ją nieodpowiednią dla aplikacji lub przypadków użycia, które wymagają generowania odpowiedzi w czasie rzeczywistym.
Podpowiedzi CoT to fenomenalna technika optymalizacji wydajności Duże modele językowe. Jeśli takie niedociągnięcia można rozwiązać za pomocą technik optymalizacji lub obejść, mogą one przynieść niesamowite rezultaty. Wraz z postępem technologicznym będzie ciekawie zobaczyć, jak podpowiadanie Chain-of-Thought ewoluuje i staje się prostsze, ale również bardziej niszowe.



