Syntetyczne rozmowy na temat opieki zdrowotnej dla ASR

Umożliwianie rozwoju technologii otoczenia poprzez syntetyczne rozmowy na temat opieki zdrowotnej

Technologia otoczenia

Ponad 2000 godzin danych dźwiękowych zebranych i przepisanych w warunkach klinicznych

W szybko rozwijającej się dziedzinie konwersacyjnej sztucznej inteligencji jednym z godnych uwagi zastosowań jest sektor opieki zdrowotnej, gdzie technologia jest wykorzystywana do usprawniania interakcji między usługodawcą a pacjentem. Nasz klient, wiodąca marka w dziedzinie technologii medycznej, zwróciła się do firmy Shaip z prośbą o ulepszenie modelu automatycznego rozpoznawania mowy (ASR), aby lepiej rozumieć i transkrybować rozmowy prowadzone przez wiele osób w warunkach klinicznych. Ze względu na przepisy dotyczące prywatności pozyskiwanie dialogów w świecie rzeczywistym było wyzwaniem; stąd pomysł polegał na stworzeniu i przepisaniu syntetycznych, ale realistycznych interakcji pomiędzy podmiotami świadczącymi opiekę zdrowotną a pacjentami.

objętość

2,000 godzin lub w przybliżeniu 12,000 do 24,000 indywidualne syntetyczne interakcje 10 średni czas trwania minut.

Cel

Naszym głównym celem było wygenerowanie około 2,000 godzin nagrań dźwiękowych, co przełożyło się na od 12,000 24,000 do XNUMX XNUMX skrupulatnie spreparowanych syntetycznych interakcji, ucieleśniających różnorodność pod względem płci, wieku, akcentu i ról medycznych. Ten kompleksowy i autentyczny zbiór danych, zaprojektowany tak, aby naśladować rzeczywiste dialogi kliniczne, został stworzony przy ścisłym przestrzeganiu przepisów dotyczących prywatności, takich jak HIPAA. Syntetyczne interakcje posłużyły jako bogaty zbiór danych, który odegrał kluczową rolę w szkoleniu i udoskonalaniu modelu ASR naszego klienta, znacznie zwiększając jego biegłość w prowadzeniu rozmów w świecie rzeczywistym w warunkach klinicznych.

 

Cele

Wyzwania

Zgodność z przepisami

Zapewnienie zgodności z przepisami dotyczącymi prywatności, takimi jak HIPAA, przy jednoczesnym tworzeniu realistycznych, ale syntetycznych interakcji w służbie zdrowia może stanowić wyzwanie.

Zgodność z przepisami

Autentyczność i różnorodność danych

Tworzenie syntetycznych interakcji, które dokładnie naśladują dialogi kliniczne w świecie rzeczywistym, a jednocześnie obejmują szeroki zakres scenariuszy, akcentów, grup wiekowych i ról medycznych, wymaga skrupulatnego podejścia i głębokiej wiedzy dziedzinowej.

Autentyczność i różnorodność danych

Zapewnienie jakości

Osiągnięcie wysokiego poziomu dokładności transkrypcji, na przykład docelowego współczynnika dokładności słów (WER) na poziomie 95% i współczynnika dokładności tagu (TER) na poziomie 90%, wymaga rygorystycznych procesów zapewniania jakości.

Możliwości techniczne

Dużym wyzwaniem jest zapewnienie, że infrastruktura techniczna, w tym platformy do nagrywania i transkrypcji, poradzi sobie z dużą ilością danych i utrzyma jakość.

Rekrutacja i szkolenie zasobów

Rekrutowanie osób z wykształceniem medycznym do odgrywania ról i upewnianie się, że przestrzegają realistycznych scenariuszy, przy jednoczesnym zachowaniu naturalnego toku rozmowy, może być sporym wyzwaniem. Ponadto szkolenie osób zajmujących się transkrypcją w zakresie przestrzegania rygorystycznych wytycznych dotyczących jakości wymaga znacznego wysiłku i wiedzy specjalistycznej.

Podejście/rozwiązanie

Kolekcja audio i transkrypcja

  • Tworzenie scenariusza: Opracowano realistyczne scenariusze odzwierciedlające typowe, niepilne stany spotykane w praktyce medycyny rodzinnej dla dorosłych, takie jak nadciśnienie, cukrzyca i leczenie bólu.
  • Odgrywanie ról: Rekrutowano osoby z wykształceniem medycznym do odgrywania ról pracowników służby zdrowia i pacjentów, stosując się do dostarczonych scenariuszy i symulując rozmowy kliniczne w świecie rzeczywistym.
  • Nagranie: Wykorzystano aplikację mobilną Shaip Work do przechwytywania dźwięku, zapewniając zróżnicowaną reprezentację uczestników pod względem płci, wieku, akcentu i wykształcenia zawodowego.

Walidacja i transkrypcja

  • Wykonane skrypty sprawdzające w celu zapewnienia dokładności i jakości plików audio.
  • Transkrypcje przeprowadzono na platformie Bhasha, stosując się do określonych wytycznych i zapewniając dosłowną transkrypcję tekstu z precyzyjną diaryzacją.
  • Metadane z adnotacjami, w tym identyfikator mówiącego, wiek, płeć, język ojczysty oraz wykształcenie/doświadczenie medyczne, które były krytyczne dla celów szkolenia modelowego klienta.

Zapewnienie jakości

  • Kompleksowe kontrole jakości przeprowadzane przez CQA i PMO zapewniły docelową jakość transkrypcji na poziomie 95% współczynnika dokładności słów (WER) i 90% współczynnika dokładności tagu (TER).

Dostarczanie danych

  • Ustrukturyzował dane w jasny i zorganizowany sposób i dostarczył je partiami, wraz ze szczegółowymi notatkami dotyczącymi partii i katalogami kultur.
  • Upewniono się, że wszystkie dane, w tym pliki audio, transkrypcje i metadane, zostały dokładnie oznaczone i sformatowane zgodnie ze specyfikacjami klienta.

Informacja zwrotna i iteracja

Utworzono solidną pętlę informacji zwrotnej z klientem w celu zidentyfikowania wszelkich braków, zapewnienia wprowadzenia poprawek i dostarczenia kompletnego, dokładnego zestawu danych.

Kluczowe osiągnięcia

  • Pomyślne zebranie i transkrypcja 2000 godzin syntetycznych interakcji w służbie zdrowia.
  • Szybka i dokładna transkrypcja z niezwykłą dokładnością, znacząco przyczyniająca się do osiągnięcia celu klienta, jakim jest ulepszenie jego modelu ASR.
  • Wykazano zdolność Shaipa do obsługi złożonych projektów na dużą skalę, przy skrupulatnym podejściu do jakości i dokładności.

Wynik

Skrupulatnie wykonany projekt przy wsparciu Shaipa zaowocował bogatym zbiorem danych, który znacząco przyczynił się do udoskonalenia modelu ASR klienta. Syntetyczne interakcje stworzyły realistyczną reprezentację dialogów klinicznych, pomagając klientowi w uzyskaniu solidniejszych i niezawodnych usług mowy dla środowisk opieki zdrowotnej. Dzięki zorganizowanemu i dobrze skoordynowanemu podejściu Shaip zapewnił pomyślną realizację złożonego projektu w określonych ramach czasowych, umacniając swoją wiedzę specjalistyczną w zarządzaniu wielkoskalowymi projektami konwersacyjnej sztucznej inteligencji w dziedzinie opieki zdrowotnej.

Nasza współpraca z Shaip znacząco rozwinęła nasz projekt w zakresie technologii otoczenia i konwersacyjnej sztucznej inteligencji w opiece zdrowotnej. Ich wiedza specjalistyczna w zakresie tworzenia i transkrypcji syntetycznych dialogów dotyczących opieki zdrowotnej zapewniła solidne podstawy, pokazując potencjał syntetycznych danych w pokonywaniu wyzwań regulacyjnych. Dzięki firmie Shaip pokonaliśmy te przeszkody i jesteśmy teraz o krok bliżej realizacji naszej wizji intuicyjnych rozwiązań w zakresie opieki zdrowotnej.

Złota pięciogwiazdkowa

Przyspiesz swoją sztuczną inteligencję w służbie zdrowia
rozwój aplikacji o 100%