Doskonalenie badań onkologicznych NLP

Precyzja danych onkologicznych: licencjonowanie, deidentyfikacja i adnotacje na potrzeby innowacji w modelu NLP

Onkologia nl

Rewolucja w leczeniu raka dzięki najnowocześniejszym technologiom NLP

Klient, główny gracz w branży opieki zdrowotnej, potrzebował zaawansowanego rozwiązania NLP do przetwarzania znacznej ilości dokumentacji medycznej z zakresu onkologii. W ramach kluczowej inicjatywy mającej na celu udoskonalenie badań onkologicznych niezwykle istotna jest potrzeba zrównoważenia szczegółowej analizy danych z rygorystycznymi standardami prywatności. W tym studium przypadku przedstawiono nasz wkład w usprawnienie wysiłków badawczych klienta poprzez adnotacje do danych o wysokiej wierności, rygorystyczne praktyki usuwania tożsamości i zastosowanie technik przetwarzania języka naturalnego (NLP), a wszystko to w ramach ram regulacyjnych określonych przez ustawę HIPAA.

objętość

Licencjonowanie danych + identyfikator danych
10 O Nas
Relacje onkologiczne
10 O Nas
Domena nieonkologiczna
10 O Nas
Negacja
10 O Nas
Domena onkologiczna
10 O Nas
NER + Mapowanie relacji
10 O Nas

Wyzwania

Projekt wymagał szczegółowego zrozumienia dokumentacji klinicznej, precyzyjnej identyfikacji podmiotów medycznych oraz umiejętności dokładnego stosowania etykiet negacji, a wszystko to w bezpiecznych ramach chroniących prywatność pacjentów zgodnie z przepisami HIPAA. Przedsięwzięcie wymagało nie tylko wiedzy technicznej w zakresie obsługi dużych ilości złożonych danych, ale także strategicznego podejścia umożliwiającego uwzględnienie informacji zwrotnych i utrzymanie jakości na wszystkich etapach procesu dodawania adnotacji.

Cele

Szczegółowy opis usług

KategoriaOpis
Kompleksowy zakres danych klinicznychObejmuje różne rodzaje notatek, warunki opieki i specjalizacje onkologiczne, zapewniając solidny zbiór danych odzwierciedlający różnorodne scenariusze kliniczne.
Rygorystyczne deidentyfikacjaZapewnienie, że wszystkie oznaczone rekordy są pozbawione danych identyfikacyjnych zgodnie z metodą Safe Harbor HIPAA, zapewniając klientowi pewność co do prywatności i bezpieczeństwa danych.
Wytyczne dotyczące adnotacjiTworzenie i wdrażanie standardowych wytycznych dotyczących adnotacji danych w celu przygotowania etykietowanych zapisów zgodnie ze standardami HIPAA.
Zaawansowane strategie adnotacjiDokonano ręcznej adnotacji na 10,000 XNUMX stronach dokumentacji związanej z onkologią, ze szczególnym naciskiem na identyfikację statusów negacji i innych istotnych informacji zgodnie z ustalonymi wytycznymi.
Rygorystyczne zapewnienie jakościOsiągnij określony standard jakości określony w wytycznych

Rozwiązanie

Nasze podejście obejmowało następujące kluczowe strategie:

Dostosowana kompilacja zestawu danych onkologicznych

Z obszernego archiwum ponad 5 MN EHR wyodrębniono starannie wybrany podzbiór danych, którego celem było spełnienie specjalistycznych wymagań klienta w zakresie danych onkologicznych, ze szczególnym uwzględnieniem jednostek genomowych. Proces gromadzenia danych obejmował utworzenie wyczerpującej listy markerów nowotworowych, genów, wariantów i stadiów TNM, wykorzystując wyszukiwanie słów kluczowych w celu zlokalizowania dokumentów bogatych w te dane. Do identyfikacji szeregu odmian genetycznych i stadiów raka wykorzystano wyrażenia regularne. Takie podejście, w połączeniu z szerokim zakresem danych obejmującym różne typy dokumentów, specjalizacje, warunki opieki i dane od wielu lekarzy, zapewniło kompleksowy i odpowiedni zbiór danych onkologicznych.

Kompilacja zbioru danych onkologicznych

Rygorystyczne deidentyfikacja

Proces odbywał się ściśle według metody HIPAA Safe Harbor w zakresie deidentyfikacji, co gwarantuje klientowi pewność co do prywatności i bezpieczeństwa danych. Wiąże się to z usunięciem wszystkich chronionych informacji zdrowotnych (PHI) i zastąpieniem ich oznaczonymi symbolami zastępczymi, co pozwala zachować użyteczność danych, a jednocześnie chroni poufność pacjenta.

Zmienne deidentyfikacyjne

KategoriaPodkategoria
ImięImię i nazwisko pacjenta, nazwisko lekarza, imię i nazwisko pielęgniarki, imię członka rodziny, nazwa centrum medycznego, nazwa kliniki, nazwa domu opieki, nazwa firmy, nazwa uniwersytetu
Wiek 
DataWzór daty, wzór miesiąca roku, wzór dnia miesiąca, wzór dnia roku, dzień, miesiąc, rok, pora roku
LokalizacjaKraj, stan, miasto, ulica, kod pocztowy, numer pokoju, numer apartamentu, numer piętra
IDNumer ubezpieczenia społecznego, numer dokumentacji medycznej, numer beneficjenta planu zdrowotnego, numer konta, numer certyfikatu/licencji, identyfikator biometryczny, identyfikator zapisu, numer dostępu, numer identyfikacyjny pojazdu, numer tablicy rejestracyjnej Identyfikatory urządzenia i numer seryjny
KontaktNumer telefonu, numer faksu, adres e-mail, adres URL strony internetowej, adres IP

Przykład:

W dniu 25 września 2106 roku o godzinie 11:00 pan Harry Pace, lat 90, został przyjęty do szpitala Forrest General Hospital na zaplanowaną operację stawu biodrowego, konsultowaną wcześniej przez jego lekarza pierwszego kontaktu, dr Jose Martina, i pod opieką Kendry Reith, lekarz medycyny Podczas swojego pobytu był pod opieką Mary Hu, NP i Suzan Ray, RN, a także konsultowano się z R. Charlesem Melanconem, PA. Operacja przeprowadzona w tym samym dniu co przyjęcie przebiegła pomyślnie i nie stwierdzono żadnych powikłań. Po operacji pan Pace został przeniesiony do sali 202 na 2. piętrze w celu rekonwalescencji. Jego żona, Emma Pace, była obecna przez cały czas i otrzymywała wszystkie niezbędne aktualizacje. Podczas jego krótkiego pobytu jego dokumentacja medyczna, w tym numer MRN MR99062619 i numer konta KV000014764, była prowadzona zgodnie ze standardowymi protokołami domu opieki Gracewood, jego poprzedniego miejsca zamieszkania. Później tego samego dnia został wypisany pod opiekę przychodni w Oakland w celu dalszej rekonwalescencji. W trakcie całego procesu wszystkie procedury zostały udokumentowane i zabezpieczone z zachowaniem standardów poufności.

Przykład: niezidentyfikowany

On [Wzór daty], o godzinie 11:00, p. [Imię pacjenta], w wieku [Wiek], został przyjęty do [Nazwa Centrum Medycznego] na zaplanowaną operację stawu biodrowego, po konsultacji z lekarzem pierwszego kontaktu, dr. [Nazwisko lekarza], i uczestniczyli [Imię i nazwisko lekarza] lekarz medycyny W czasie pobytu był pod opieką [Pielęgniarka stażystka], NP i [Pielęgniarka stażystka], RN, z [Nazwisko lekarza], PA, również będące w trakcie konsultacji. Operacja przeprowadzona w tym samym dniu co przyjęcie przebiegła pomyślnie i nie stwierdzono żadnych powikłań. Po operacji p. [Imię pacjenta] został przeniesiony do pokoju nr. [Numer pokoju], Piętro nr. [Numer piętra], do odzysku. Jego żona [nazwisko członka rodziny] była obecna przez cały czas i otrzymywała wszystkie niezbędne aktualizacje. Podczas jego krótkiego pobytu, jego dokumentacja medyczna, w tym MRN [Numer dokumentacji medycznej] i Konto [Numer konta], były obsługiwane zgodnie ze standardowymi protokołami [Nazwa domu opieki], jego poprzednie miejsce zamieszkania. Jeszcze tego samego dnia został wypisany pod opiekę [Nazwa kliniki] na dalszą regenerację. W trakcie całego procesu wszystkie procedury zostały udokumentowane i zabezpieczone z zachowaniem standardów poufności.

Wytyczne dotyczące adnotacji i zaawansowane techniki adnotacji

Shaip odegrał kluczową rolę w ustaleniu i wdrożeniu standardowych wytycznych dotyczących adnotacji danych, co zapewniło, że wszystkie oznakowane dokumenty zostały przygotowane spójnie i zgodnie ze standardami HIPAA. Ponadto skrupulatnie opatrzono adnotacjami 10,000 XNUMX stron różnych dokumentacji medycznych, ze szczególnym uwzględnieniem szczegółowego oznakowania statusów negacji i innych klinicznie istotnych jednostek, w tym różnych specjalności onkologicznych. Adnotacji dokonał zespół ekspertów-komentatorów posiadających specjalistyczną wiedzę z zakresu onkologii i przepisów dotyczących ochrony danych.

Złożone kryteria adnotacji

KategoriaPodkategoria
Adnotacja daty (onkologia)Data diagnozy, Data etapu, Początek, Data zabiegu, Data rozpoczęcia leczenia, Data zakończenia leczenia, Data rozpoczęcia napromieniania, Data zakończenia napromieniania
Choroba (Onkologia)Problem nowotworowy, histologia, stan kliniczny, umiejscowienie ciała, zachowanie, stopień, stadium raka, stadium TNM, test markerowy nowotworu, wymiary, kod
Leczenie (Onkologia)Lek na raka, dawkowanie leku, częstotliwość, operacja nowotworu, wynik operacji, modalność radioterapii, dawkowanie promieniowania
GenomicsKod zmiany, badanie genu, metoda, próbka
NegacjaNegatywne, możliwe negatywne, niepewne, możliwe pozytywne
Kliniczny NERProblem nowotworowy – lokalizacja ciała, histologia – lokalizacja ciała, zachowanie – lokalizacja ciała, operacja nowotworu – relacje, lokalizacja ciała, modalność promieniowania – lokalizacja ciała, histologia – stopień, problem nowotworowy – wymiar

Przykład:

Oświadczenie dotyczące notatki klinicznej z onkologii

Oświadczenie dotyczące notatki klinicznej z zakresu onkologii

„W dniu 03 u pacjentki Jane Doe zdiagnozowano niedrobnokomórkowego raka płuc (NSCLC) w stopniu IIIB, a konkretnie gruczolakoraka. Rak zlokalizowany jest w prawym dolnym płacie płuca. Jest klasyfikowany jako T05N2023M3 zgodnie z systemem stopni zaawansowania TNM, z guzem o wymiarach 2 cm x 0 cm. Delecję w eksonie 5 EGFR zidentyfikowano poprzez analizę PCR próbki z biopsji guza. Chemioterapię karboplatyną AUC 3 i pemetreksedem 19 mg/m² rozpoczęto 5 i należy ją podawać co 500 tygodnie. Rozpoczęcie radioterapii wiązkami zewnętrznymi (EBRT) w dawce 03 Gy w 20 frakcjach 2023r. Leczenie pacjenta jest w toku, a w ostatnim badaniu MRI nie stwierdzono przerzutów do mózgu. Nie ustalono jeszcze możliwości inwazji naczyń limfatycznych, a tolerancja pacjenta na pełny schemat chemioterapii pozostaje niepewna.

Oświadczenie dotyczące notatki klinicznej z zakresu onkologii

Oświadczenie dotyczące notatki klinicznej z onkologii

Rygorystyczne zapewnienie jakości

Wdrożyłem elastyczne ramy zarządzania projektami, które ułatwiły skuteczną integrację opinii klientów przy jednoczesnym zachowaniu rygorystycznych standardów jakości. Wdrożono kompleksowy protokół zapewnienia jakości, zgodny z wytycznymi, aby osiągnąć wymagane standardy jakości. Protokół ten obejmował kolejne rundy przeglądu i weryfikacji, zapewniające precyzję i wiarygodność danych z adnotacjami. Taki skrupulatny nadzór nad jakością ma kluczowe znaczenie w tworzeniu niezawodnego rozwiązania NLP, niezbędnego do podejmowania świadomych decyzji klinicznych i doskonałości badawczej.

Wynik

Pomyślnie dostarczono 10,000 XNUMX wysokiej jakości niezidentyfikowanych, oznakowanych rekordów, zapewniając bezpieczny i cenny zbiór danych na potrzeby rozwoju modelu NLP klienta. Skrupulatne stosowanie NLP i przestrzeganie standardów deidentyfikacji HIPAA zaowocowało wysoce dopracowanym zbiorem danych, który będzie podstawą bieżących i przyszłych wysiłków klienta w zakresie badań onkologicznych, ostatecznie mających na celu poprawę wyników leczenia pacjentów onkologicznych i efektywności świadczenia opieki.

Sukces projektu ilustruje naszą zdolność do precyzyjnego przetwarzania złożonych danych medycznych, przyczyniając się do osiągnięcia celu klienta, jakim jest poprawa wyników opieki nad pacjentem i przyspieszenie tempa innowacji w opiece zdrowotnej.

Nasza współpraca z Shaip odegrała zasadniczą rolę w rozwijaniu naszych możliwości NLP w dziedzinie onkologii. Profesjonalna obsługa 10,000 XNUMX dokumentacji medycznej, opatrzonej szczegółowymi zaprzeczeniami i opisami innych jednostek klinicznych, pokazała ich zaangażowanie w doskonałość i zgodność. Co więcej, ich zaangażowanie w standardy prywatności, takie jak HIPAA, zapewniło nam nieocenione zasoby, które pozwalają nam rozwijać nasze inicjatywy w zakresie sztucznej inteligencji polegające na opracowywaniu najnowocześniejszych metod leczenia i diagnostyki onkologicznej.

Złota pięciogwiazdkowa

Przyspiesz swoją sztuczną inteligencję w służbie zdrowia
rozwój aplikacji o 100%