Harvard undergrad AI-Modell hilft vorherzusagen TB Widerstand

Eine der größten Herausforderungen in der Behandlung von Tuberkulose—die top-infektiöse killer weltweit, nach Angaben der World Health Organization (WHO)—ist das Bakterium die Fähigkeit zur Gestaltwandlung schnell und resistent gegen mehrere Medikamente. Die Identifizierung resistenter Stämme schnell und die Wahl der richtigen Antibiotika zu behandeln, bleibt schwierig, aus mehreren Gründen, einschließlich der Bakterie Neigung langsam zu wachsen, im Labor, was Verzögerungen bei der Medikamenten-Empfindlichkeit-test-Ergebnisse, indem Sie so viel wie sechs Wochen nach der ersten Diagnose.

Neue tests können schnell und zuverlässig erkennen, Widerstand zu den allgemein verwendetsten Drogen, bevor ein patient beginnt die Behandlung sind dringend notwendig, um die Ergebnisse zu verbessern und helfen, die Eindämmung der Ausbreitung der Infektion.

Nun, Harvard College angewandte Mathematik-student Michael Chen ’20, die Arbeit mit biomedizinischen Forscher an der Harvard Medical School Blavatnik Institut, hat ein computer-Programm, das die Bühne für die Entwicklung solcher tests.

Das Programm, beschrieben. April 29 in EBioMedicine, kann genau Vorhersagen, einen TB-Stamm Widerstand gegen die 10 first – und second-line-Medikamente, ein Zehntel einer Sekunde und mit größerer Genauigkeit als ähnliche Modelle.

Wenn incorporated in klinischen tests, die Modell machen könnte Widerstand Erkennung sowohl schneller als auch genauer, die überwindung der Mängel in der aktuellen Resistenz-Testverfahren, die entweder zu lange dauern Ausbeute endgültige Ergebnisse oder sind unzuverlässig.

„Medikamenten-resistenten Formen der Tuberkulose sind schwer zu erkennen, schwer zu behandeln, und deuten auf schlechte Ergebnisse für die Patienten“, sagt senior-Autor der Studie Maha Farhat, assistant professor of biomedical informatics an der Harvard Medical School und einer pneumologischen Spezialisten am Massachusetts General Hospital. „Die Fähigkeit, schnell zu erkennen das vollständige Profil von Widerstand bei der Diagnose ist entscheidend sowohl für die Verbesserung der einzelnen Patienten Ergebnisse-und bei der Verringerung der Ausbreitung der Infektion auf andere.“

Das neue Modell wird in Kürze online als ein zusätzliches feature an der Harvard Medical School genTB tool, analysiert die TB-Daten und sagt Voraus, TB drug resistance.

Mehr als 10 Millionen neue TB-Fälle diagnostiziert werden jedes Jahr weltweit, nach Angaben der WHO. Diese neuen Infektionen, 4 Prozent resistent gegen mindestens zwei Medikamente—eine form der Krankheit, bekannt als multiresistente Tuberkulose oder MDR-TB. Der Medikamenten-resistenten Infektionen, die man in 10 sind extensiv resistenten (XDR-TB, und zeigen gute Resistenz gegen mehrere Medikamente. First-line-Medikamente gegeben werden, sobald eine Infektion festgestellt, während die second-line-Behandlungen Hinzugefügt werden, wenn der patient zeigt Symptome von Widerstand oder ein test zeigt, dass der Bakterien-Stamm ist unempfindlich gegen first-line-Behandlungen.

Unvollkommene Prüfung

In der sich entwickelnden Welt, wo Drogen-Empfindlichkeit Tests kann schwierig sein, zu erhalten, viele Menschen Tuberkulose diagnostiziert behandelt werden empirisch, basieren auf wenig mehr als ausgebildete klinische Spekulation und Annahme.

Weniger als die Hälfte der Länder mit einer hohen Prävalenz der MDR-TB-Infektionen sind mit modernen Diagnose-Möglichkeiten. Selbst in den am besten ausgestatteten Labors, konventionellen, Kultur-based drug sensitivity Tests dauert es Wochen oder Monate, bevor die Ergebnisse berichtet werden können, weil die TB-Bakterium neigt, langsam zu wachsen, in Gerichten, ein Nachteil, der vergrößert, von kleinen, aber realen Infektionsrisiko konfrontiert, Labor-Arbeiter, die mit TB-Proben.

Neue molekulare tests, die für die Untersuchung der DNA von TB-Beispiele für Resistenz-Gene werden immer häufiger verwendet, aber Sie haben Ihre eigenen Grenzen—das wichtigste ist, dass Sie erkennen, Widerstand nur bis zu vier Medikamenten, und nicht zuverlässig. Sie können auch nicht erkennen, das Vorhandensein von seltenen genetischen Varianten, die Anlass zu Widerstand.

Der beste Weg, zu erkennen, alle resistance-conferring Mutationen ist die Durchführung einer Analyse eines Bakteriums vollständige Genom. Es gibt mehrere Medikamenten-Empfindlichkeit von tests basierend auf whole-genome-sequencing-Daten, und während Sie erkennen, Widerstand zu allen first-line-Medikamente, neigen Sie dazu, schlecht durchführen, die auf Widerstand-Erkennung zur second-line-Medikamente, so die Forscher.

Diese tests neigen auch dazu, zu klassifizieren, die eine mutation in einem einfachen, binary Mode—entweder als übertragung von Resistenzen oder nicht—das macht Sie unzuverlässig Detektoren von Resistenzen in Sorten, die sehr seltenen Mutationen oder Mutationen von unbekannter Bedeutung. Ein weiterer Kritischer blinden Fleck der aktuellen Modelle mit dem whole-genome-Daten ist Ihre Unfähigkeit, zu beurteilen, die Wechselwirkungen zwischen verschiedenen Genen und genetischen Mutationen; in anderen Worten, wie das Vorhandensein von einem gen oder eine gen-Variante beeinflusst die Funktion der anderen, ein Phänomen, bekannt als epistasis. Das neue Modell überwindet dieses Manko.

Über die einfache Erkennung

Zur Lösung der Herausforderung, die Wissenschaftler dargelegt, um ein Programm zu erstellen, dass könnte die Erfassung der synergistischen Effekte mehrerer Mutationen. Sie entwickelt und getestet, fünf rechnerische Modelle, von denen zwei die Stand-auch für Ihre Richtigkeit. Der eine war ein statistisches Modell basiert auf einer form der logistischen regression analysis, eine Methode zur Bewertung der Wirkung einer variable auf eine andere. Der andere war in einem neuronalen Netzwerk-Ansatz, kombiniert zwei Arten der Analyse—wide learning und deep learning. Die breiten-learning-Teil des Modells ist ähnlich einem statistischen Modell, bei dem jede mutation kodiert wird, die als eine variable, die entweder verleiht Resistenz oder nicht. Die Tiefe-learning-Teil enthält ausgeblendete Ebenen beurteilen, dass die interaktiven Effekte mehrerer Gene und mehrerer Mutationen. Das Ergebnis ist ein Modell, das sich mehr oder weniger wie ein Diagnose-tool, als beurteilen kann, alle verfügbaren Informationen mit den Vorkenntnissen, um eine Bestimmung über den Widerstand.

„Unser Ziel war die Entwicklung eines neuronalen Netzwerk-Modell, welches eine Art des maschinellen Lernens, die lose ähnelt, wie die verbindungen zwischen den Neuronen gebildet sind, in das Gehirn,“ sagte Chen, der zu schreiben begann das Programm im ersten Jahr und ist nun ein junior, die einen Abschluss in angewandter Mathematik mit einem sekundären Abschluss in computer science. Die Studie der erste Autor, plant er die medizinische Schule zu gehen.

„Der Breite und Tiefe neuronale Netzwerk vernetzt zwei Formen des maschinellen Lernens zu identifizieren, die die kombinierten Effekte von genetischen Varianten auf die Antibiotika-Resistenz“, sagte Chen.

Die Logistische regression-Modell und die breit-und-tief-Lern-Modell durchgeführt vergleichbar, aber die Breite-und-Tiefe-Modell hatte einen leichten Vorteil in der Vorhersage der Resistenz gegen mehrere second-line-Therapien aufgrund Ihrer Fähigkeit zur Analyse der kombinierten Effekte von mehreren Mutationen, die auf eine Belastung Widerstand, als auch die Auswirkungen der extrem seltene genetische Mutationen, die mit wenig oder unbekannter Bedeutung. Diese letztere Eigenschaft macht die wide-und deep learning Modell genauer in Ihren Vorhersagen als frühere Modelle, die research-team, sagte, gibt es die Möglichkeit zu erfassen Widerstand auch in Proben, die enthalten seltene gen-Mutationen, deren Einfluss auf das Medikament die Empfindlichkeit ist nicht gut verstanden. Im Gegensatz dazu bisher entwickelten machine-learning-Plattformen verlassen sich auf spotting gemeinsamen gen-Mutationen, die bereits bekannt sind und verursacht Widerstand.

„Die Breite-und-Tiefe-Modell ist ein Entscheidungs-tool, das vereint alle, die die Daten vor der biologischen Erkenntnis, daß der Widerstand wird verursacht sowohl durch große individuelle Mutationen und die Interaktionen zwischen den vielen verschiedenen Mutationen,“ sagte Studie co-senior-Autor Andy Strahl, Mitglied der Fakultät in biomedical informatics an der HMS und Gastdozent an der Harvard T. H. Chan School of Public Health.

Die Qualität der Bildung

Was die Modelle erfolgreich? Forscher schreiben den Umfang der Daten, auf denen die Programme wurden „geschult.“ Anstatt zu lernen, einen vordefinierten Satz von gemeinsamen genetischen Mutationen, die bekannt sind, um zu fördern die Widerstandskraft, die Modelle wurden ausgesetzt, um ein Daten-set enthalten sind eine Vielzahl von genetischen Mutationen mit einer Vielzahl von gen-Insertionen und-Deletionen und extrem seltenen Varianten, die nur in wenigen der Isolate oder sogar zu isolieren.

Die Modelle wurden geschult, auf 3,601 TB-Stämme resistent gegen first – und second-line-Medikamente, einschließlich 1,228 multidrug-resistente Stämme. Die Daten enthalten die Ergebnisse von Drogen-Empfindlichkeit testen, so dass das Modell zu beurteilen, den Zusammenhang zwischen dem vorliegen bestimmter Mutationen und Drogen-Empfindlichkeit. Die Trainings-sets wurden generiert mit Daten aus verschiedenen Ländern, kuratiert von Wissenschaftlerinnen und Wissenschaftlern der Kritische Pfad-Institut, mit der Unterstützung von der Bill &-Melinda-Gates-Stiftung.

Zum testen Ihrer Leistungsfähigkeit in einer realistischen Einstellung, die Modelle wurden aufgefordert, vorherzusagen, Widerstand in einer Reihe von 792 vollständig sequenziert TB Genome, Sie hatte noch nie „gesehen“ vor. Dadurch entstand ein high-fidelity-Test-Szenario, das eliminiert die chance, dass die Modelle würden auf bekannte Stämme hatten Sie „studierte“, die während der Ausbildung.

Die Breite-und-Tiefe neuronale Netzwerk-Modell vorhergesagt Widerstand gegen first-line-Medikamente mit 94-prozentiger Genauigkeit im Durchschnitt und 90 Prozent Genauigkeit zu second-line-Medikamente, im Durchschnitt. Die statistischen Modell vorhergesagten Widerstand mit 94 Prozent und 88 Prozent Genauigkeit, beziehungsweise. Die Breite-und-Tiefe neuronale Netzwerk-Modell zeigten etwas höhere Genauigkeit in der Vorhersage der Resistenz gegen drei bestimmte Drogen.

Beide Modelle sind in der Lage, die Vorhersage Beständigkeit first – und second-line-Therapien in einem Zehntel einer Sekunde, unterstreicht die zunehmend wichtige Rolle von künstlicher Intelligenz und big data spielen wird, in der raschen Erkennung und Wahl der Therapie für die Krankheit.