Integration von Künstlicher Intelligenz und Deep Learning im medizinischen Umfeld
Wie kann Künstliche Intelligenz die Gesundheitsversorgung verbessern?
Medizin beruht auf Daten und Informationen - Ärzte stellen Diagnosen auf Basis von Untersuchungsergebnissen und Laborwerten. Die Zulassung neuer Medikamente geschieht auf der Grundlage von Versuchsreihen und Studien. Gemeinsam mit unseren Partnern entwickeln wir Methoden der Künstlichen Intelligenz, welche die komplexen und umfangreichen Datenmengen veranschaulichen, Therapieansätze individualisieren, die pharmazeutische Forschung und Dokumentation effizienter und die klinische Dokumentationen einfacher macht.
Medizinische Daten sind zumeist sensibel und persönlich, sodass sie ausschließlich von behandelnden Ärzten verarbeitet werden. Unsere Modelle ermöglichen den angemessenen Umgang damit: PSIORIs CDISC Pipeline ist beispiels weise zum Betrieb in der Infrastruktur des Kunden ausgelegt. Die Daten verlassen diese Infrastruktur nicht.
Künstliche Intelligenz kann ebenso Teil von zertifizierten Medizinprodukten sein: Für einen Partner konnten wir ein Modell zur Unterstützung der schnellen und effektiven Auswertung von Langzeit-EKGs entwickeln. Dieses Produkt inklusive der KI ist als Medizinprodukt zertifiziert und wurde mit dem German Medical Award ausgezeichnet.
Beispiele:
Erkennen nicht-lebensfähiger Zellen für Single-Cell-Printer
Für zahlreiche Verfahren in der Pharmazie und Medizin werden Zellkulturen benötigt. Eine Methode für das Anlegen von Zellkulturen sind so genannte Single-Cell-Printer. Ein Problem bei dieser Methode stellen nicht lebensfähige Zellen dar, da Zellkulturen auf Basis dieser Zellen nicht wachsen. Das bisher verwendete Verfahren zur Erkennung nicht-lebensfähiger Zellen vor dem Drucken ist zeitaufwändig und einzelne Zellen müssen manuell überprüft werden. PSIORI hat ein Deep-Learning Modell zur automatischen Klassifikation einzelner Zellen in “lebensfähig” und “nicht-lebensfähig” mit einer Erkennungsrate von 99% entwickelt. Eine derart hohe Erkennungsrate macht die manuelle Überprüfung überflüssig.
PSIORIs Modell zur automatisierten Klassifikation von Zellen basiert auf tiefen neuronalen Netzen zur Bildklassifikation und verwendet zusätzlich einige Methoden des klassischen maschinellen Sehens. Das Verfahren klassifiziert Zellen anhand von Mikroskopie Aufnahmen aus dem Single-Cell-Printer.
Es erkennt nicht-lebensfähige Zellen durch eine Auswertung der Bildinformation aus Mikroskopie-Aufnahmen. Tiefe neuronale Netze sind für solche Fragestellungen besonders gut geeignet, da sie aufgrund kleiner Unterschiede in Bildern präzise Klassifikationsmerkmale (Features) lernen können. Um die Aufgabe für das neuronale Netz zu erleichtern, werden die Bilder mit klassischen Methoden des maschinellen Sehens vorverarbeitet.
Klassifikation von PCR-Kurven
PCR-Tests sind das zuverlässigste Verfahren zur Detektion von Virus-RNA im menschlichen Körper mit einer analytischen Spezifität von nahezu 100%. Die aktuelle Covid-19 Pandemie hat PCR-Tests in der Bevölkerung bekannt gemacht, sie werden zur Detektion verschiedenster Virusinfektionen eingesetzt, wie beispielsweise HIV oder Influenza. Die Auswertung von PCR-Tests erfolgt im allgemeinen automatisiert in einer Laborsoftware. Diese Modelle werden für die Detektion verschiedener Viren an die einzelnen Assays angepasst. PSIORI hat ein Deep-Learning Verfahren entwickelt, das den Aufwand dieser Anpassung verringern soll.
Ein tiefes neuronales Netz klassifiziert einzelne PCR-Kurven. Das Netz lernt die typische Form des exponentiellen Anstiegs als positiv und kann ihre Variationen erkennen. Das PSIORI Verfahren kann neben eindeutig positiv oder negativ klassifizierten Kurven auch unklare Fälle als eine eigene Klasse erkennen. In der Anwendung würden diese einem menschlichen Bearbeiter zur Entscheidung vorgelegt werden. Das Modell erreicht nach dem Training auf einer niedrig fünfstelligen Anzahl an PCR-Kurven ohne Finetuning Ergebnisse, die mit State-of-the-art Lösungen vergleichbar sind. Es kann durch einfaches Nachtraining leicht auf neue Assays angepasst werden.
Das verwendete Modell beruht auf PSIORI-STaR, einer spezifischen Architektur tiefer neuronaler Netze zur Verarbeitung multivariater Zeitreihen. Da das tiefe neuronale Netz nicht unbedingt die charakteristische Form einer positiven bzw. negativen Kurve lernt, sondern zusätzlich die Merkmale, welche die Klassen lokal unterscheiden, reicht ein Nachtraining auf wenigen Daten für die Übertragung auf ein neues Assay aus.
Vorhofflimmern automatisch erkennen
Vorhofflimmern ist eine häufige Ursache für Schlaganfälle. Um Vorhofflimmern zu erkennen, müssen Langzeit-EKGs von Ärzten aufwändig ausgewertet werden. PSIORI hat eine Software und ein Deep-Learning Modell entwickelt, das Vorhofflimmern automatisiert erkennt. Damit verkürzt sich die Zeit zur Auswertung eines Langzeit-EKGs auf einige Minuten. Die Software ist als Medizingerät zertifiziert.
Das von PSIORI entwickelte Deep Learning Modell lernt auf tausenden Langzeit EKGs Vorhofflimmern zu erkennen. Das Modell erkennt Abschnitte eines Langzeit EKGs, in denen Vorhofflimmern vorliegen könnte. Die Software legt diese dem Arzt zur Auswertung vor. Das Modell arbeitet auf 3-Kanal EKGs, wie sie von kleinen Geräten aufgezeichnet werden, die im Alltag getragen werden können. Das Modell ist darauf ausgelegt keine falsch negativen Ergebnisse zu produzieren und jeden auffälligen Zeitabschnitt dem Arzt vorzulegen.
Das Modell basiert auf PSIORI-STaR, einer spezifischen Architektur tiefer neuronaler Netze zur Verarbeitung multivariater Zeitreihen. Dabei werden die drei Kanäle des EKG gemeinsam analysiert. Das Modell ist dadurch robust gegenüber kleinen Unregelmäßigkeiten z.B. aufgrund von nicht ganz fest sitzenden Klebern beim Tragen des Aufzeichnungsgerätes im Alltag.
Krebsregister Datenbank
Krebs ist die weltweit häufigste Todesursache. Je nahtloser Daten zum Krankheitsverlauf erfasst werden können, desto spezifischer werden die Therapieansätze. PSIORI hat ein Datenmodell für ein Krebsregister entwickelt, das die Auswertung der gespeicherten Daten im Hinblick auf individualisierte Behandlungsansätze von Anfang an mitdenkt.
Die Datenbank des Krebsregisters hat die datenbasierte Auswertung im Fokus. Visualisierungen und Datenanalysen können einfach darauf aufgebaut werden. Die Technologie basiert auf dem Framework Ruby on Rails.
Data Science Tool für klinische Studien und Register
In Studien und Registern erhobene Daten werden in regelmäßigen Abständen ausgewertet. Statistiker wenden dazu ihre Skripte auf die jeweiligen Daten an. Das manuelle Verarbeiten ist jedoch aufwendig und zeitintensiv. PSIORI hat ein Data Science Tool mit einer benutzerfreundlichen Oberfläche entwickelt, mit dem Standardanalysen graphisch zusammengestellt und gespeichert werden können. Mit dem Tool können auch Projektbeteiligte ohne technischen oder statistischen Hintergrund Auswertungen ihrer Projekte erstellen.
Die Daten kommen aus einem Data Warehouse, welches Daten aus mehreren Studien und Registern enthalten kann. Darauf aufsetzend speichert das Backend des Data Science Tools nicht die Daten selbst, sondern Filterregeln und Berechnungsvorschriften für Populationen und Konfigurationen vordefinierter Analysen.
Das Tool ermöglicht verschiedene Standardanalysen sowie die Erstellung von Tabellen und spezifischen Analysen wie Time-to-Event Analysen und Cox Regressionen. Für Ansätze, die nicht in den Standard-Analysen enthalten sind, stellt das Tool die Anbindung eines Jupyter-Notebook Servers für R und Python an die Backend- und Data Warehouse Datenbanken bereit.
Klinische Dokumentationen vereinfachen
Klinische Dokumentation kostet Zeit und erfordert eigens geschulte Mitarbeiter. Um alle Fallpauschalen für geleistete Behandlung und verbrauchtes Material für eine Behandlung zu erhalten, muss eine Klinik sicherstellen, dass alle betreffenden ICD-Codes dokumentiert und in der Falldokumentation belegt sind. PSIORI hat verschiedene Modelle entwickelt, die fehlende Codes vorschlagen und Belege für dokumentierte Codes in der Falldokumentation finden.
Fehlende ICD-Codes können direkt aus den §21-Daten des Falles vorgeschlagen werden. Ein probabilistisches Modell lernt auf einem größeren Datensatz den Zusammenhang verschiedener Haupt- und Nebendiagnosen und schlägt solche Codes vor, die sehr häufig gemeinsam mit den bereits dokumentierten auftreten, sofern diese fehlen. Weitere Modelle nutzen vorhandene Laborbefunde, um in Form eines Expertensystems direkt aus den Befunden ICD-Codes vorzuschlagen. Das Expertensystem funktioniert auf Basis des Wissens erfahrener Dokumentierer. Ein weiteres Modell verknüpft Laborbefunde mit den §21-Daten in einem Deep-Learning Modell und kann aus der resultierenden Einbettung wahrscheinlich fehlende Codes ableiten. Ein probabilistisches NLP-Modell findet zusätzlich Belegstellen für dokumentierte Codes in Texten.
Das Gesamtmodell ist dazu gedacht, einem menschlichen Dokumentierer Hilfestellung zu geben und den Dokumentationsprozess zu beschleunigen.
Psiori-Health Tools
Tools, die die Health AI vorantreiben
PSIORI Data Browser - Zeitreihen effizient visualisieren und durchsuchen
Der PSIORI Data Browser ist ein Tool zur einfachen Visualisierung und Annotation multivariater Zeitreihen. Beispiele solcher Daten aus dem medizinischen Bereich sind EKG- oder EEG-Aufzeichnungen.
Mit dem PSIORI Data Browser können Zeitreihen visualisiert, die entsprechenden Kanäle ausgewählt und Skalen der Kanäle angepasst werden. Der Data Browser erlaubt einen Zoom in die Daten, sodass Auflösung und (zeitliche) Länge des betrachteten Abschnitts ausgewählt werden können. Dabei kann durch den gesamten Datensatz gescrollt werden.
Zusätzlich ermöglicht der Data Browser das Durchsuchen der Zeitreihe nach ähnlichen Abschnitten. Dazu wird ein Abschnitt von Interesse (in beliebigem Zoomlevel) per Mausklick markiert. Ein tiefes neuronales Netz lernt, aus diesem einen Beispiel ähnliche Abschnitte zu finden. Es können auch Negativbeispiele markiert werden - Abschnitte, die nicht zu den Gesuchten gehören. Die Markierungen ermöglichen ein einfaches Springen von einem gefundenen Abschnitt zum nächsten. Sie können mit Labels versehen und gespeichert werden.
Die Illustration zeigt den Einsatz des Data Browser auf einem 3-Kanal EKG. Der gezeigte Abschnitt umfasst ca. 2 Minuten einer Aufzeichnung von insgesamt 72 Stunden. Die untere Liste im Bildschirm zeigt Länge und Position des angezeigten Abschnitts im Gesamtdatensatz an. Ein QRS-Komplex wurde ausgewählt und alle QRS-Komplexe in der Aufzeichnung markiert.
Visualizer - Große Datenmengen anschaulich darstellen
Der PSIORI Visualizer macht Strukturen in großen und komplexen Datensätzen sichtbar. Dabei lernt ein tiefes neuronales Netz die wichtigsten Strukturmerkmale eines Datensatzes und bildet sie in einem dreidimensionalen Raum ab. Ein Beispiel für solche Datensätze sind Genexpressionen von Zellen, wie sie in Krebsdatensätzen abgebildet sind.
Der hier gezeigte Auszug aus dem Visualizer zeigt die Einbettung eines Datensatzes von 500 unterschiedlichen Zellen, beschrieben durch 60.000 Genexpressionen. Der Visualizer kann über 1.5 Millionen Datenpunkte gleichzeitig anzeigen und als Punktewolke darstellen. Zur besseren Mustererkennung können die Punkte entsprechend ihrer Eigenschaften eingefärbt und optisch voneinander abgegrenzt werden. Für eine möglichst genaue Analyse der Daten kann die Darstellung gedreht und bis zu einzelnen Datenpunkten hineingezoomt werden.
CDISC Pipeline - Big Data Technologie für medizinische Studien und Register
Die PSIORI CDISC Pipeline stellt Daten medizinischer Studien und Register in vollständig CDISC-konformer Datenstruktur tagesaktuell zur Verfügung. Die Pipeline baut auf etablierten Big Data Technologien auf und überträgt diese auf das Feld medizinischer Studien und Register. Die Pipeline kann sowohl on Premise als auch in verschiedenen Cloud Umgebungen betrieben werden. Sie baut vollständig auf Open Source Bibliotheken auf und erfordert keine zusätzlichen Lizenzen.
Daten aus EDC Systemen können mit weiteren Daten zusammengeführt werden. SDTM und ADaM Dateien nach Definition des Anwenders werden tagesaktuell automatisiert erzeugt. Alle Daten stehen der medizinischen Statistik sowie für weitere Auswertungen zur Verfügung. Insbesondere sind alle Daten auf jedem tagesaktuellen Datenstand aus der Vergangenheit verfügbar und jede Analyse damit jederzeit nachvollziehbar.
Um die Definition von SDTM- und ADaM-Dateien zu vereinfachen, hat PSIORI hat eine Domain Specific Language (DSL) entwickelt, welche auf YAML basiert. Vorhandene Kodierung (MedDra o.ä.) kann hier direkt in die Definition der SDTM- und ADaM-Dateien integriert werden. Die Definition von SDTM und ADaM-Dateien für die Pipeline erfolgt standardmäßig in dieser DSL, vorhandene Definitionen können eingebunden werden.