Zbiór wypowiedzi tekstowych

Dlaczego sztuczna inteligencja konwersacyjna potrzebuje dobrych danych dotyczących wypowiedzi?

Czy zastanawiałeś się kiedyś, jak chatboty i wirtualni asystenci budzą się, gdy mówisz „Hej Siri” lub „Alexa”? Dzieje się tak ze względu na gromadzenie wypowiedzi tekstowych lub wyzwalanie słów wbudowanych w oprogramowanie, które aktywuje system, gdy tylko usłyszy zaprogramowane słowo budzące.

Jednak cały proces tworzenia dźwięków i danych wypowiedzi nie jest taki prosty. Jest to proces, który należy przeprowadzić odpowiednią techniką, aby uzyskać pożądane rezultaty. Dlatego ten blog pokaże drogę do tworzenia dobrych wypowiedzi/słów wyzwalających, które bezproblemowo współpracują z Twoją konwersacyjną sztuczną inteligencją.

Czym są wypowiedzi?

Wypowiedzi można nazwać frazami lub słowami wyzwalającymi używanymi do aktywowania modelu sztucznej inteligencji. Gdy Twój model sztucznej inteligencji wykryje słowo budzące, automatycznie zaczyna rejestrować następne żądanie użytkownika i odpowiada odpowiednią akcją lub odpowiedzią.

Wypowiedź wykorzystuje koncepcję głębokiego uczenia się, aby nauczyć oprogramowanie rozpoznawania słów budzących. Gdy słowo budzące aktywuje oprogramowanie, system rozpoczyna przechwytywanie, dekodowanie i obsługę żądania. Gdy nie jest używany, system pasywnie nasłuchuje słów wyzwalających.

Aby oprogramowanie AI mogło uzyskiwać dokładne wyniki, niezbędne jest uchwycenie mnóstwa różnych wypowiedzi dla każdego celu. Pomaga w lepszym szkoleniu modelu AI.

[Przeczytaj także: Czy chcesz wiedzieć, jak Siri i Alexa Cię rozumieją?]

Punkty do zapamiętania podczas tworzenia repozytorium wypowiedzi

Teraz, gdy wiemy, że szkolenie jest ważne dla modeli AI, następną rzeczą, którą należy wiedzieć, jest dostarczanie wypowiedzi do modeli AI. Zwykle tworzone jest repozytorium wypowiedzi, aby szkolić konwersacyjne AI.

Jest jednak kilka rzeczy, o których należy pamiętać budując repozytoria wypowiedzi. Oto rzeczy do rozważenia:

Points to remember to collect good utterances

Intencja użytkownika

Przede wszystkim, przygotowując wypowiedzi dla swojego modelu AI, upewnij się, że rozumiesz intencje użytkownika, dla którego tworzysz zbiory danych. Musisz poznać różne wypowiedzi, które użytkownicy mogą wprowadzać podczas rozmowy z modelem AI.

Wariacja wypowiedzi

Odmiany są istotną częścią tego procesu, ponieważ im więcej odmian dla każdego zamiaru, tym lepsze wyniki osiągniesz. Dlatego upewnij się, że tworzysz wiele odmian wypowiedzi użytkowników. Możesz to zrobić przez

  • Tworzenie krótkich, średnich i dużych zdań dla tych samych zdań.
  • Zmiana słów i długości zdań.
  • Używając unikalnych słów.
  • Pluralizowanie zdań.
  • Mieszanie gramatyki.

Wypowiedzi nie zawsze są dobrze sformułowane

Większość ludzi ma zwyczaj używania fragmentarycznych zdań w swoich rozmowach. W kontaktach z robotami chcą mieć taką samą wygodę. Dlatego w swoich danych treningowych powinieneś nie tylko uwzględniać pełne zdania ustrukturyzowane, ale także dodawać literówki, błędy ortograficzne i luźno wypowiedziane zdania.

Wykorzystywanie reprezentatywnych warunków i referencji

Tworząc wypowiedzi, używaj standardowej terminologii i odniesień, które rozumie większość ludzi. Pamiętaj, że nie musisz budować świetnego robota używającego wyrafinowanego języka, który mogą posiąść tylko eksperci. Zamiast tego skup się na formułowaniu wypowiedzi, które są bardzo powszechne i łatwo zrozumiałe dla wszystkich.

Zmieniaj frazy i terminologię

Częstym błędem, który często popełnia wielu trenerów AI, jest używanie różnych zdań, ale nie zmienianie w nich słów kluczowych. Załóżmy na przykład, że tworzysz wypowiedzi typu „W którym pokoju jest telewizor?”, „Gdzie jest telewizor?”, „Gdzie znajdę telewizor?”.

Zdania mogą się zmieniać we wszystkich tych wypowiedziach, ale rdzeń słowa „telewizja” pozostaje ten sam. Musisz więc upewnić się, że używasz odmian dla wszystkiego, co wprowadzasz. Więc zamiast telewizji możesz użyć synonimów tego słowa.

Przykładowe wypowiedzi dla każdej intencji

Przykładowe wypowiedzi są przypisane do każdej zaplanowanej intencji. Większość platform szkoleniowych AI sugeruje dodanie co najmniej 10-15 wypowiedzi na intencję. Na szczęście większość środowisk programistycznych umożliwia dodawanie wypowiedzi, tworzenie i testowanie modelu oraz ponowne odwiedzanie wypowiedzi.

Tak więc najlepszą praktyką dla właściwego wyodrębniania encji i poprawnego przewidywania intencji jest najpierw dodanie kilku wyrażeń, przetestowanie ich, a następnie dodanie innych danych wejściowych.

Testowanie i przeglądanie w rzeczywistych scenariuszach

Testowanie modelu AI jest kluczowe, aby był doskonały. Najlepiej jednak przetestować model na różnych grupach osób, które niewiele wiedzą o projekcie.

Ujawni luki, które zwykle nie są wykrywane przez Twój zespół, ponieważ Twój zespół ma wspólne zrozumienie projektowanego modelu AI.

Oprócz tego mamy również stały przegląd wypowiedzi użytkowników. Zaprezentuje wydajność modeli AI i będziesz mógł zaktualizować model o lepsze reformy i dane.

Wnioski

Ostatecznie na sukces Twojej konwersacyjnej sztucznej inteligencji składa się kilka czynników. Dlatego najlepiej przeszkolić modelkę od profesjonalnego serwisu, który rozumie zawiłości projektu. To będzie najlepszy sposób na wytrenowanie modelu do perfekcji. Możesz skontaktuj się z naszym zespołem Shaip aby omówić Twoje wymagania i poznać nasz proces.

[Przeczytaj także: Kompletny przewodnik po konwersacyjnej sztucznej inteligencji]

Podziel społecznej