wissen.de Artikel
Wie die Informatik der Biologie Flügel verleiht
Die Forschung in der Biochemie oder molekularen Medizin produziert häufig Unmengen von Daten. Doch wie bei der Entschlüsselung des menschlichen Genoms ist das nur der Anfang der Arbeit. Denn erst durch die Analyse und Verknüpfung dieser Daten erhalten die Wissenschaftler die entscheidenden Informationen. Die riesigen Datenberge zu interpretieren, ist allerdings gar nicht so einfach. "Ohne effiziente Verfahren der bio- und medizinischen Informatik wird man sie nicht nutzen können", sagt Hans-Werner Mewes von der TU München.
Gen zur Fahndung ausgeschrieben
Mehrere zehntausend Gene bestimmten Aufbau und Funktion unseres Körpers und sind damit auch oft Ursachen bestimmter Krankheiten. Ist man beispielsweise durch die familiäre Krankheitsgeschichte prädestiniert für Brustkrebs, lohnt es sich für Frauen, ihr Genom nach den Risikogenen BRCA-1 und BRCA-2 durchsuchen zu lassen. Denn sind diese mutiert, steigt das Risiko an Brustkrebs zu erkranken, um 60 bis 80 Prozent an.
Doch leichter gesagt als getan: "Die Interpretation der gigantischen Datenmengen kann ein Biologe gar nicht selbst leisten" sagt Mewes. Diese Aufgabe übernehmen daher intelligente Computernetzwerke, die das Erbgut nach den beiden Genen in kürzester Zeit scannen können und so frühzeitig Maßnahmen zur Brustkrebs-Prävention ermöglichen.
Die Gesamtheit der Gene eines Menschen so schnell untersuchen zu können, ist auch nützlich, um bestimmte Risikogene identifizieren zu können. Durch computergestützte Analysen des Erbguts von Menschen, die an der gleichen, unbekannten Krankheit leiden, können genetische Gemeinsamkeiten gefunden werden. Diese sind dann möglicherweise die Ursache der Krankheit und ermöglichen Therapieansätze.

Künstliche Intelligenz als Diagnosehelfer
Neben "klassischen" Computeranalysen kommen in der Bioinformatik aber auch Künstliche Intelligenzen wie beispielsweise neuronale Netzwerke zum Einsatz. Solche Systeme werden mit schon ausgewerteten Daten trainiert, um dann später selbstständig Entscheidungen treffen und Analysen durchführen zu können. Soll ein KI-System beispielsweise lernen, Brustkrebs zu erkennen, bekommt es zunächst einen Satz von Mammografie-Aufnahmen, in denen Tumore markiert sind.
"Man muss dem Computer sagen, welche Zelle auf dem Bild eine Krebszelle ist, damit er daraus lernen und am Ende Krebszellen selbständig erkennen kann", erklärt Shadi Albarqouni von der TU München. Anhand dieser Trainingsbilder lernt das System dann, die typischen Strukturen des Krebses zu erkennen und von gesundem Gewebe zu unterscheiden. Später kann die Künstliche Intelligenz dann selbstständig Mammografie-Aufnahmen nach diesen verdächtigen Strukturen durchsuchen und diese anzeigen. Einige solcher Systeme schneiden in der Diagnose von Brustkrebs, Hautkrebs und anderen Tumoren bereits ähnlich gut ab wie menschliche Radiologen.

Computerspiel hilft beim KI-Training
Doch der Künstlichen Intelligenz solche diagnostischen Fähigkeiten beizubringen, kann eine langwierige Angelegenheit werden. " Albarqouni hat daher zusammen mit seinen Kollegen ein Computerspiel entwickelt, durch das freiwillige Helfer beim Training der lernfähigen Computer helfen können.
Im Spiel geht es darum, möglichst viele "böse" Krebszellen abzuschießen und den Computer so für die Gewebeanalyse zu trainieren.
KI zur Entschlüsselung von Proteinfaltung
Die Lernfähigkeit von Künstlichen Intelligenzen macht man sich auch in einem weiteren Gebiet der Bioinformatik zunutze: der Strukturaufklärung von Proteinen.
Die Funktion von Proteinen zu kennen, ist wichtig, um Krankheiten zu verstehen und Medikamente oder Impfstoffe entwickeln zu können. Die Proteinfunktion wiederum beruht auf der dreidimensionalen Struktur dieser Biomoleküle - doch die nachzuvollziehen, ist unvorstellbar komplex: Für ein Protein mit einer Länge von 150 Aminosäuren gäbe es beispielsweise 2150 verschiedene Möglichkeiten, sich zu falten. Die Bestimmung der korrekten 3D-Struktur und damit der Funktion eines Proteins, können deshalb nur Computersysteme leisten.
Die kürzlich entwickelte künstliche Intelligenz AlphaFold des Google-ForschungszentrumsDeepMind wurde beispielsweise mit 170.000 Proteinsequenzen und deren aufgeklärten Strukturen trainiert, sodass die KI Gesetzmäßigkeiten in der Proteinfaltung erkennen kann. Wenn das neuronale Netzwerk nun nach dem Training eine unbekannte Aminosäuresequenz erhält, kann es dieser eine Proteinstruktur zuordnen, die den zuvor gelernten Regeln am ehesten entspricht.