Doskonalenie badań onkologicznych NLP
Precyzja danych onkologicznych: licencjonowanie, deidentyfikacja i adnotacje na potrzeby innowacji w modelu NLP
Rewolucja w leczeniu raka dzięki najnowocześniejszym technologiom NLP
Klient, główny gracz w branży opieki zdrowotnej, potrzebował zaawansowanego rozwiązania NLP do przetwarzania znacznej ilości dokumentacji medycznej z zakresu onkologii. W ramach kluczowej inicjatywy mającej na celu udoskonalenie badań onkologicznych niezwykle istotna jest potrzeba zrównoważenia szczegółowej analizy danych z rygorystycznymi standardami prywatności. W tym studium przypadku przedstawiono nasz wkład w usprawnienie wysiłków badawczych klienta poprzez adnotacje do danych o wysokiej wierności, rygorystyczne praktyki usuwania tożsamości i zastosowanie technik przetwarzania języka naturalnego (NLP), a wszystko to w ramach ram regulacyjnych określonych przez ustawę HIPAA.
objętość
Wyzwania
Projekt wymagał szczegółowego zrozumienia dokumentacji klinicznej, precyzyjnej identyfikacji podmiotów medycznych oraz umiejętności dokładnego stosowania etykiet negacji, a wszystko to w bezpiecznych ramach chroniących prywatność pacjentów zgodnie z przepisami HIPAA. Przedsięwzięcie wymagało nie tylko wiedzy technicznej w zakresie obsługi dużych ilości złożonych danych, ale także strategicznego podejścia umożliwiającego uwzględnienie informacji zwrotnych i utrzymanie jakości na wszystkich etapach procesu dodawania adnotacji.
Szczegółowy opis usług
Kategoria | Opis |
Kompleksowy zakres danych klinicznych | Obejmuje różne rodzaje notatek, warunki opieki i specjalizacje onkologiczne, zapewniając solidny zbiór danych odzwierciedlający różnorodne scenariusze kliniczne. |
Rygorystyczne deidentyfikacja | Zapewnienie, że wszystkie oznaczone rekordy są pozbawione danych identyfikacyjnych zgodnie z metodą Safe Harbor HIPAA, zapewniając klientowi pewność co do prywatności i bezpieczeństwa danych. |
Wytyczne dotyczące adnotacji | Tworzenie i wdrażanie standardowych wytycznych dotyczących adnotacji danych w celu przygotowania etykietowanych zapisów zgodnie ze standardami HIPAA. |
Zaawansowane strategie adnotacji | Dokonano ręcznej adnotacji na 10,000 XNUMX stronach dokumentacji związanej z onkologią, ze szczególnym naciskiem na identyfikację statusów negacji i innych istotnych informacji zgodnie z ustalonymi wytycznymi. |
Rygorystyczne zapewnienie jakości | Osiągnij określony standard jakości określony w wytycznych |
Rozwiązanie
Nasze podejście obejmowało następujące kluczowe strategie:
Dostosowana kompilacja zestawu danych onkologicznych
Z obszernego archiwum ponad 5 MN EHR wyodrębniono starannie wybrany podzbiór danych, którego celem było spełnienie specjalistycznych wymagań klienta w zakresie danych onkologicznych, ze szczególnym uwzględnieniem jednostek genomowych. Proces gromadzenia danych obejmował utworzenie wyczerpującej listy markerów nowotworowych, genów, wariantów i stadiów TNM, wykorzystując wyszukiwanie słów kluczowych w celu zlokalizowania dokumentów bogatych w te dane. Do identyfikacji szeregu odmian genetycznych i stadiów raka wykorzystano wyrażenia regularne. Takie podejście, w połączeniu z szerokim zakresem danych obejmującym różne typy dokumentów, specjalizacje, warunki opieki i dane od wielu lekarzy, zapewniło kompleksowy i odpowiedni zbiór danych onkologicznych.
Rygorystyczne deidentyfikacja
Proces odbywał się ściśle według metody HIPAA Safe Harbor w zakresie deidentyfikacji, co gwarantuje klientowi pewność co do prywatności i bezpieczeństwa danych. Wiąże się to z usunięciem wszystkich chronionych informacji zdrowotnych (PHI) i zastąpieniem ich oznaczonymi symbolami zastępczymi, co pozwala zachować użyteczność danych, a jednocześnie chroni poufność pacjenta.
Zmienne deidentyfikacyjne
Kategoria | Podkategoria |
Imię | Imię i nazwisko pacjenta, nazwisko lekarza, imię i nazwisko pielęgniarki, imię członka rodziny, nazwa centrum medycznego, nazwa kliniki, nazwa domu opieki, nazwa firmy, nazwa uniwersytetu |
Wiek | |
Data | Wzór daty, wzór miesiąca roku, wzór dnia miesiąca, wzór dnia roku, dzień, miesiąc, rok, pora roku |
Lokalizacja | Kraj, stan, miasto, ulica, kod pocztowy, numer pokoju, numer apartamentu, numer piętra |
ID | Numer ubezpieczenia społecznego, numer dokumentacji medycznej, numer beneficjenta planu zdrowotnego, numer konta, numer certyfikatu/licencji, identyfikator biometryczny, identyfikator zapisu, numer dostępu, numer identyfikacyjny pojazdu, numer tablicy rejestracyjnej Identyfikatory urządzenia i numer seryjny |
Kontakt | Numer telefonu, numer faksu, adres e-mail, adres URL strony internetowej, adres IP |
Przykład:
W dniu 25 września 2106 roku o godzinie 11:00 pan Harry Pace, lat 90, został przyjęty do szpitala Forrest General Hospital na zaplanowaną operację stawu biodrowego, konsultowaną wcześniej przez jego lekarza pierwszego kontaktu, dr Jose Martina, i pod opieką Kendry Reith, lekarz medycyny Podczas swojego pobytu był pod opieką Mary Hu, NP i Suzan Ray, RN, a także konsultowano się z R. Charlesem Melanconem, PA. Operacja przeprowadzona w tym samym dniu co przyjęcie przebiegła pomyślnie i nie stwierdzono żadnych powikłań. Po operacji pan Pace został przeniesiony do sali 202 na 2. piętrze w celu rekonwalescencji. Jego żona, Emma Pace, była obecna przez cały czas i otrzymywała wszystkie niezbędne aktualizacje. Podczas jego krótkiego pobytu jego dokumentacja medyczna, w tym numer MRN MR99062619 i numer konta KV000014764, była prowadzona zgodnie ze standardowymi protokołami domu opieki Gracewood, jego poprzedniego miejsca zamieszkania. Później tego samego dnia został wypisany pod opiekę przychodni w Oakland w celu dalszej rekonwalescencji. W trakcie całego procesu wszystkie procedury zostały udokumentowane i zabezpieczone z zachowaniem standardów poufności.
Przykład: niezidentyfikowany
On [Wzór daty], o godzinie 11:00, p. [Imię pacjenta], w wieku [Wiek], został przyjęty do [Nazwa Centrum Medycznego] na zaplanowaną operację stawu biodrowego, po konsultacji z lekarzem pierwszego kontaktu, dr. [Nazwisko lekarza], i uczestniczyli [Imię i nazwisko lekarza] lekarz medycyny W czasie pobytu był pod opieką [Pielęgniarka stażystka], NP i [Pielęgniarka stażystka], RN, z [Nazwisko lekarza], PA, również będące w trakcie konsultacji. Operacja przeprowadzona w tym samym dniu co przyjęcie przebiegła pomyślnie i nie stwierdzono żadnych powikłań. Po operacji p. [Imię pacjenta] został przeniesiony do pokoju nr. [Numer pokoju], Piętro nr. [Numer piętra], do odzysku. Jego żona [nazwisko członka rodziny] była obecna przez cały czas i otrzymywała wszystkie niezbędne aktualizacje. Podczas jego krótkiego pobytu, jego dokumentacja medyczna, w tym MRN [Numer dokumentacji medycznej] i Konto [Numer konta], były obsługiwane zgodnie ze standardowymi protokołami [Nazwa domu opieki], jego poprzednie miejsce zamieszkania. Jeszcze tego samego dnia został wypisany pod opiekę [Nazwa kliniki] na dalszą regenerację. W trakcie całego procesu wszystkie procedury zostały udokumentowane i zabezpieczone z zachowaniem standardów poufności.
Wytyczne dotyczące adnotacji i zaawansowane techniki adnotacji
Shaip odegrał kluczową rolę w ustaleniu i wdrożeniu standardowych wytycznych dotyczących adnotacji danych, co zapewniło, że wszystkie oznakowane dokumenty zostały przygotowane spójnie i zgodnie ze standardami HIPAA. Ponadto skrupulatnie opatrzono adnotacjami 10,000 XNUMX stron różnych dokumentacji medycznych, ze szczególnym uwzględnieniem szczegółowego oznakowania statusów negacji i innych klinicznie istotnych jednostek, w tym różnych specjalności onkologicznych. Adnotacji dokonał zespół ekspertów-komentatorów posiadających specjalistyczną wiedzę z zakresu onkologii i przepisów dotyczących ochrony danych.
Złożone kryteria adnotacji
Kategoria | Podkategoria |
Adnotacja daty (onkologia) | Data diagnozy, Data etapu, Początek, Data zabiegu, Data rozpoczęcia leczenia, Data zakończenia leczenia, Data rozpoczęcia napromieniania, Data zakończenia napromieniania |
Choroba (Onkologia) | Problem nowotworowy, histologia, stan kliniczny, umiejscowienie ciała, zachowanie, stopień, stadium raka, stadium TNM, test markerowy nowotworu, wymiary, kod |
Leczenie (Onkologia) | Lek na raka, dawkowanie leku, częstotliwość, operacja nowotworu, wynik operacji, modalność radioterapii, dawkowanie promieniowania |
Genomics | Kod zmiany, badanie genu, metoda, próbka |
Negacja | Negatywne, możliwe negatywne, niepewne, możliwe pozytywne |
Kliniczny NER | Problem nowotworowy – lokalizacja ciała, histologia – lokalizacja ciała, zachowanie – lokalizacja ciała, operacja nowotworu – relacje, lokalizacja ciała, modalność promieniowania – lokalizacja ciała, histologia – stopień, problem nowotworowy – wymiar |
Przykład:
Oświadczenie dotyczące notatki klinicznej z zakresu onkologii
„W dniu 03 u pacjentki Jane Doe zdiagnozowano niedrobnokomórkowego raka płuc (NSCLC) w stopniu IIIB, a konkretnie gruczolakoraka. Rak zlokalizowany jest w prawym dolnym płacie płuca. Jest klasyfikowany jako T05N2023M3 zgodnie z systemem stopni zaawansowania TNM, z guzem o wymiarach 2 cm x 0 cm. Delecję w eksonie 5 EGFR zidentyfikowano poprzez analizę PCR próbki z biopsji guza. Chemioterapię karboplatyną AUC 3 i pemetreksedem 19 mg/m² rozpoczęto 5 i należy ją podawać co 500 tygodnie. Rozpoczęcie radioterapii wiązkami zewnętrznymi (EBRT) w dawce 03 Gy w 20 frakcjach 2023r. Leczenie pacjenta jest w toku, a w ostatnim badaniu MRI nie stwierdzono przerzutów do mózgu. Nie ustalono jeszcze możliwości inwazji naczyń limfatycznych, a tolerancja pacjenta na pełny schemat chemioterapii pozostaje niepewna.
Oświadczenie dotyczące notatki klinicznej z zakresu onkologii
Rygorystyczne zapewnienie jakości
Wdrożyłem elastyczne ramy zarządzania projektami, które ułatwiły skuteczną integrację opinii klientów przy jednoczesnym zachowaniu rygorystycznych standardów jakości. Wdrożono kompleksowy protokół zapewnienia jakości, zgodny z wytycznymi, aby osiągnąć wymagane standardy jakości. Protokół ten obejmował kolejne rundy przeglądu i weryfikacji, zapewniające precyzję i wiarygodność danych z adnotacjami. Taki skrupulatny nadzór nad jakością ma kluczowe znaczenie w tworzeniu niezawodnego rozwiązania NLP, niezbędnego do podejmowania świadomych decyzji klinicznych i doskonałości badawczej.
Wynik
Pomyślnie dostarczono 10,000 XNUMX wysokiej jakości niezidentyfikowanych, oznakowanych rekordów, zapewniając bezpieczny i cenny zbiór danych na potrzeby rozwoju modelu NLP klienta. Skrupulatne stosowanie NLP i przestrzeganie standardów deidentyfikacji HIPAA zaowocowało wysoce dopracowanym zbiorem danych, który będzie podstawą bieżących i przyszłych wysiłków klienta w zakresie badań onkologicznych, ostatecznie mających na celu poprawę wyników leczenia pacjentów onkologicznych i efektywności świadczenia opieki.
Sukces projektu ilustruje naszą zdolność do precyzyjnego przetwarzania złożonych danych medycznych, przyczyniając się do osiągnięcia celu klienta, jakim jest poprawa wyników opieki nad pacjentem i przyspieszenie tempa innowacji w opiece zdrowotnej.
Nasza współpraca z Shaip odegrała zasadniczą rolę w rozwijaniu naszych możliwości NLP w dziedzinie onkologii. Profesjonalna obsługa 10,000 XNUMX dokumentacji medycznej, opatrzonej szczegółowymi zaprzeczeniami i opisami innych jednostek klinicznych, pokazała ich zaangażowanie w doskonałość i zgodność. Co więcej, ich zaangażowanie w standardy prywatności, takie jak HIPAA, zapewniło nam nieocenione zasoby, które pozwalają nam rozwijać nasze inicjatywy w zakresie sztucznej inteligencji polegające na opracowywaniu najnowocześniejszych metod leczenia i diagnostyki onkologicznej.
Przyspiesz swoją sztuczną inteligencję w służbie zdrowia
rozwój aplikacji o 100%