Studium przypadku: konwersacyjna sztuczna inteligencja
Precyzja danych onkologicznych: licencjonowanie, deidentyfikacja i adnotacje na potrzeby innowacji w modelu NLP
Rewolucja w leczeniu raka dzięki najnowocześniejszym technologiom NLP.
Przegląd projektu
Klient, główny gracz w branży opieki zdrowotnej, potrzebował zaawansowanego rozwiązania NLP do przetwarzania znacznej ilości dokumentacji medycznej z zakresu onkologii. W ramach kluczowej inicjatywy mającej na celu udoskonalenie badań onkologicznych niezwykle istotna jest potrzeba zrównoważenia szczegółowej analizy danych z rygorystycznymi standardami prywatności. W tym studium przypadku przedstawiono nasz wkład w usprawnienie wysiłków badawczych klienta poprzez adnotacje do danych o wysokiej wierności, rygorystyczne praktyki usuwania tożsamości i zastosowanie technik przetwarzania języka naturalnego (NLP), a wszystko to w ramach ram regulacyjnych określonych przez ustawę HIPAA.
Kluczowe statystyki
Licencjonowanie danych
+ De-ID danych
stron 10,000
Nieonkologia
Domena
stron 10,000
Onkologia
Domena
stron 10,000
Onkologia
Relacje
stron 4500
Negacja
stron 9000
NER + Związek
Mapowanie
stron 1223
Wyzwania
Projekt wymagał szczegółowego zrozumienia dokumentacji klinicznej, precyzyjnej identyfikacji podmiotów medycznych oraz umiejętności dokładnego stosowania etykiet negacji, a wszystko to w bezpiecznych ramach chroniących prywatność pacjentów zgodnie z przepisami HIPAA. Przedsięwzięcie wymagało nie tylko wiedzy technicznej w zakresie obsługi dużych ilości złożonych danych, ale także strategicznego podejścia umożliwiającego uwzględnienie informacji zwrotnych i utrzymanie jakości na wszystkich etapach procesu dodawania adnotacji.
Szczegółowy opis usług:
- Kompleksowe dane kliniczne: Obejmując różne rodzaje notatek, środowisk opieki i podspecjalizacji onkologicznych, zapewnia kompleksowy zbiór danych odzwierciedlający różnorodne scenariusze kliniczne.
- Rygorystyczna deidentyfikacja: Zapewnienie, że wszystkie oznaczone rekordy są pozbawione danych identyfikacyjnych zgodnie z metodą Safe Harbor HIPAA, zapewniając klientowi pewność co do prywatności i bezpieczeństwa danych.
- Wytyczne dotyczące adnotacji: Tworzenie i wdrażanie standardowych wytycznych dotyczących adnotacji danych w celu przygotowania etykietowanych zapisów zgodnie ze standardami HIPAA.
- Zaawansowane techniki adnotacji: Zastosowanie przetwarzania języka naturalnego do 10,000 XNUMX stron dokumentacji onkologicznej, obejmującej skomplikowane etykietowanie statusów negacji i innych istotnych szczegółów zgodnie z wcześniej ustalonymi wytycznymi.
- Rygorystyczne zapewnienie jakości: Osiągnąć określony standard jakości określony w wytycznych.
Rozwiązanie
Nasze podejście obejmowało następujące kluczowe strategie:
Kompleksowy zakres danych klinicznych
Aby dostosować zbiór danych do konkretnych potrzeb klienta, starannie wyodrębniono ukierunkowany wybór danych z rozległego repozytorium Shaipa, obejmującego ponad 5 milionów elektronicznych dokumentacji medycznych. Ten starannie dobrany zbiór danych obejmował różnorodne typy notatek i ustawienia opieki, zapewniając bogate i różnorodne
spektrum scenariuszy klinicznych. Zapewnia to zbiór danych, który jest nie tylko kompleksowy, ale także wysoce reprezentatywny dla rzeczywistych danych medycznych.
Rygorystyczne deidentyfikacja
Proces odbywał się ściśle według metody HIPAA Safe Harbor w zakresie deidentyfikacji, co gwarantuje klientowi pewność co do prywatności i bezpieczeństwa danych. Wiąże się to z usunięciem wszystkich chronionych informacji zdrowotnych (PHI) i zastąpieniem ich oznaczonymi symbolami zastępczymi, co pozwala zachować użyteczność danych, a jednocześnie chroni poufność pacjenta.
Zmienne deidentyfikacyjne
| Kategoria | Podkategoria |
|---|---|
| Imię i nazwisko | Imię i nazwisko pacjenta, nazwisko lekarza, imię i nazwisko pielęgniarki, imię członka rodziny, nazwa centrum medycznego, nazwa kliniki, nazwa domu opieki, nazwa firmy, nazwa uniwersytetu |
| Wiek | |
| Data | Wzór daty, wzór miesiąca roku, wzór dnia miesiąca, wzór dnia roku, dzień, miesiąc, rok, pora roku |
| Lokalizacja | Kraj, stan, miasto, ulica, kod pocztowy, numer pokoju, numer apartamentu, numer piętra |
| ID | Numer ubezpieczenia społecznego, numer dokumentacji medycznej, numer beneficjenta planu zdrowotnego, numer konta, numer certyfikatu/licencji, identyfikator biometryczny, identyfikator rekordu, numer akcesyjny, numer identyfikacyjny pojazdu, numer tablicy rejestracyjnej, identyfikatory urządzeń i numer seryjny |
| Kontakt | Numer telefonu, numer faksu, adres e-mail, adres URL strony internetowej, adres IP |
Przykład:
W dniu 25 września 2106 roku o godzinie 11:00 pan Harry Pace, lat 90, został przyjęty do szpitala Forrest General Hospital na zaplanowaną operację stawu biodrowego, konsultowaną wcześniej przez jego lekarza pierwszego kontaktu, dr Jose Martina, i pod opieką Kendry Reith, lekarz medycyny Podczas swojego pobytu był pod opieką Mary Hu, NP i Suzan Ray, RN, a także konsultowano się z R. Charlesem Melanconem, PA. Operacja przeprowadzona w tym samym dniu co przyjęcie przebiegła pomyślnie i nie stwierdzono żadnych powikłań. Po operacji pan Pace został przeniesiony do sali 202 na 2. piętrze w celu rekonwalescencji. Jego żona, Emma Pace, była obecna przez cały czas i otrzymywała wszystkie niezbędne aktualizacje. Podczas jego krótkiego pobytu jego dokumentacja medyczna, w tym numer MRN MR99062619 i numer konta KV000014764, była prowadzona zgodnie ze standardowymi protokołami domu opieki Gracewood, jego poprzedniego miejsca zamieszkania. Później tego samego dnia został wypisany pod opiekę przychodni w Oakland w celu dalszej rekonwalescencji. W trakcie całego procesu wszystkie procedury zostały udokumentowane i zabezpieczone z zachowaniem standardów poufności.
Przykład: niezidentyfikowany
On [Wzór daty], o godzinie 11:00, p. [Imię pacjenta], w wieku [Wiek], został przyjęty do [Nazwa Centrum Medycznego] na zaplanowaną operację stawu biodrowego, po konsultacji z lekarzem pierwszego kontaktu, dr. [Imię i nazwisko lekarza]i w którym uczestniczyło [Imię i nazwisko lekarza] lekarz medycyny W czasie pobytu był pod opieką [Pielęgniarka], NP i [Pielęgniarka], RN, z [Imię i nazwisko lekarza], PA, również konsultowany. Jego operacja, przeprowadzona tego samego dnia, co przyjęcie, zakończyła się sukcesem, bez zgłoszonych powikłań. Po operacji, Pan [Imię pacjenta] został przeniesiony do pokoju nr. [Numer pokoju], Piętro nr. [Numer piętra], w celu odzyskania zdrowia. Jego żona, [Imię członka rodziny], był obecny przez cały czas i otrzymał wszystkie niezbędne aktualizacje. Podczas jego krótkiego pobytu jego dokumentacja medyczna, w tym MRN [Numer dokumentacji medycznej] i Konto [Numer konta], były obsługiwane zgodnie ze standardowymi protokołami [Nazwa domu opieki], jego poprzednie miejsce zamieszkania. Został wypisany później tego samego dnia pod opiekę [Nazwa kliniki] na dalszą regenerację. W trakcie całego procesu wszystkie procedury zostały udokumentowane i zabezpieczone z zachowaniem standardów poufności.
Wytyczne dotyczące adnotacji i zaawansowane techniki adnotacji
Shaip odegrał kluczową rolę w ustanowieniu i wdrożeniu standardowych wytycznych adnotacji danych, zapewniając, że wszystkie Oznaczone Zapisy były przygotowywane spójnie i zgodnie ze standardami HIPAA. Ponadto 10,000 XNUMX stron z różnych dokumentacji medycznych zostało skrupulatnie opatrzonych adnotacjami,
skupienie się na szczegółowym etykietowaniu statusów negacji i innych klinicznie istotnych jednostek, w tym różnych podspecjalności onkologicznych. Adnotacje zostały przeprowadzone przez zespół ekspertów adnotujących ze specjalistyczną wiedzą w zakresie onkologii i przepisów dotyczących prywatności danych.
Złożona adnotacja
| Kategoria | Podkategoria |
|---|---|
| Data Adnotacja (Onkologia) | Data diagnozy, Data stadium, Początek, Data procedury, Data rozpoczęcia leczenia, Data zakończenia leczenia, Data rozpoczęcia radioterapii, data zakończenia radioterapii |
| Choroba (Onkologia) | Problem nowotworowy, histologia, stan kliniczny, umiejscowienie ciała, zachowanie, stopień, stadium raka, stadium TNM, test markerowy nowotworu, wymiary, kod |
| Leczenie (Onkologia) | Lek na raka, dawkowanie leku, częstotliwość, operacja nowotworu, wynik operacji, modalność radioterapii, dawkowanie promieniowania |
| Genomics | Kod zmiany, badanie genu, metoda, próbka |
| Negacja | Negatywne, możliwe negatywne, niepewne, możliwe pozytywne |
| Kliniczny NER Relacje | Problem raka – Miejsce na ciele, Histologia – Miejsce na ciele, Zachowanie – Miejsce na ciele, Chirurgia raka – Miejsce na ciele, Modalność radioterapii – Miejsce na ciele, Histologia – Stopień, Problem raka – Wymiar |
Przykład:
Oświadczenie dotyczące notatki klinicznej z zakresu onkologii
„W dniu 03 u pacjentki Jane Doe zdiagnozowano niedrobnokomórkowego raka płuc (NSCLC) w stopniu IIIB, a konkretnie gruczolakoraka. Rak zlokalizowany jest w prawym dolnym płacie płuca. Jest klasyfikowany jako T05N2023M3 zgodnie z systemem stopni zaawansowania TNM, z guzem o wymiarach 2 cm x 0 cm. Delecję w eksonie 5 EGFR zidentyfikowano poprzez analizę PCR próbki z biopsji guza. Chemioterapię karboplatyną AUC 3 i pemetreksedem 19 mg/m² rozpoczęto 5 i należy ją podawać co 500 tygodnie. Rozpoczęcie radioterapii wiązkami zewnętrznymi (EBRT) w dawce 03 Gy w 20 frakcjach 2023r. Leczenie pacjenta jest w toku, a w ostatnim badaniu MRI nie stwierdzono przerzutów do mózgu. Nie ustalono jeszcze możliwości inwazji naczyń limfatycznych, a tolerancja pacjenta na pełny schemat chemioterapii pozostaje niepewna.
Oświadczenie dotyczące notatki klinicznej w zakresie onkologii:
Rygorystyczne zapewnienie jakości
Wdrożono elastyczne ramy zarządzania projektami, które ułatwiły skuteczną integrację opinii klientów przy jednoczesnym zachowaniu rygorystycznych standardów jakości. Wdrożono kompleksowy protokół zapewnienia jakości, zgodny z wytycznymi, aby osiągnąć wymagane standardy jakości. Protokół ten obejmował kolejne rundy przeglądu i weryfikacji, zapewniając precyzję i niezawodność adnotowanych danych. Tak skrupulatny nadzór nad jakością jest kluczowy w tworzeniu niezawodnego rozwiązania NLP, niezbędnego do świadomego podejmowania decyzji klinicznych i doskonałości badań.
Wynik
Pomyślnie dostarczono 10,000 XNUMX wysokiej jakości, odidentyfikowanych etykietowanych rekordów, zapewniając bezpieczny i wartościowy zestaw danych do rozwoju modelu NLP klienta. Skrupulatne zastosowanie NLP i przestrzeganie standardów odidentyfikacji HIPAA zaowocowało wysoce dopracowanym zestawem danych, który będzie podstawą bieżących i przyszłych wysiłków badawczych klienta w zakresie onkologii, ostatecznie mających na celu poprawę wyników leczenia pacjentów onkologicznych i wydajności świadczenia opieki.
Sukces projektu jest dowodem naszej zdolności do precyzyjnego przetwarzania skomplikowanych danych medycznych, co przyczynia się do realizacji celu klienta, jakim jest poprawa wyników opieki nad pacjentami i przyspieszenie tempa innowacji w opiece zdrowotnej.
Nasza współpraca z Shaip odegrała zasadniczą rolę w rozwijaniu naszych możliwości NLP w dziedzinie onkologii. Profesjonalna obsługa 10,000 XNUMX dokumentacji medycznej, opatrzonej szczegółowymi zaprzeczeniami i opisami innych jednostek klinicznych, pokazała ich zaangażowanie w doskonałość i zgodność. Co więcej, ich zaangażowanie w standardy prywatności, takie jak HIPAA, zapewniło nam nieocenione zasoby, które pozwalają nam rozwijać nasze inicjatywy w zakresie sztucznej inteligencji polegające na opracowywaniu najnowocześniejszych metod leczenia i diagnostyki onkologicznej.