Mit Professor Christian Conrad vom Berlin Institute Health in der Charité Berlin durfte ich ein Videogespräch für Intel führen. In diesem Kontext wollte ich wissen, was für schnelle und präzise Genom-Analysen erforderlich ist, warum diese auf Cloud-Instanzen durchgeführt werden und warum dabei superschnelle Rechner erforderlich sind.
Die Analysesoftware von Sention wurde an den Intel Xeon Prozessor der 4. Generation angepasst
Im Gegensatz zur Single-Cell-Short-Read-Sequenzierung werden bei dem Long-Read-Verfahren biologische Nano-Poren analysiert. Dabei werden die Ladungsunterschiede der Basen gemessen. Hierbei sind die zu untersuchenden Fragmente länger, zudem lässt sich die Sequenzierung parallel durchführen. Hierfür kommen Barcodes zum Einsatz, die wiederum aufwändig zugeordnet werden müssen, was einen zusätzlich enormen Rechenaufwand bedeutet.
Daher stand eine wesentliche Beschleunigung der Analysealgorithmen ganz weit oben auf der Agenda. Dies ist gelungen mithilfe der in Assembler programmierten Spezial-Software von Sentieon, die an den Intel Xeon Prozessor der 4. Generation angepasst wurde. Herausgekommen ist eine 14-fache Beschleunigung bei der Analyse von Einzelzellen im Long-Read-Verfahren.

Deshalb findet die Genomdaten-Sequenzierung auf einem Cloud-Rechner statt
Die Berechnungen und Analysemethoden werden immer komplexer, und auch die Datenmengen nehmen kontinuierlich zu. Damit ist ein an die jeweiligen Bedürfnisse schnell anpassbares Rechensystem unabdingbar. Das können herkömmliche HPC-Systeme im Rechenzentrum gar nicht leisten, da sich die jeweils erforderliche Konfiguration in der Kürze der Zeit nicht herstellen ließe.
Daher ist eine Cloud-Instanz in vielerlei Hinsicht einem lokalen Rechnersystem überlegen, sei es bei der Speicherausstattung, bei der Anzahl an erforderlichen Prozessoren oder anderes mehr. Damit ist ein Genom-Analysesystem in der Cloud weitaus skalier- und anpassbarer als herkömmliche HPC-Rechner.

Darum kommt es bei der Sequenzierung von Genomdaten so sehr auf die Analysegeschwindigkeit an
Auch bei der Genom-Analyse kommt es auf die richtigen Trainingsdaten an. Daher nehmen die zugehörigen KI-Modelle sehr viel Rechenzeit in Anspruch, was schnelle und leistungsfähige Maschinen erfordert. Gleichzeitig sind für neue und komplexe Behandlungsmethoden Analysemöglichkeiten unabdingbar, die in Echtzeit erfolgen können.
Die Rede ist von intraoperativen Maßnahmen, die während eines Eingriffs erforderlich und lebensrettend sein können. Darauf werden Krankenhäuser und andere medizinische Einrichtungen künftig mehr und mehr abhängig sein. Dazu gehört auch das schnelle Analysieren von Genomdaten, wofür extrem leistungsstarke Rechner unbedingt erforderlich sind.

Weitere Infos zu dem Projekt auf bihealth.org und intel.com
Zu diesem gemeinsamen Projekt des BIH, Sentieon und Intel gibt es auf den entsprechenden Seiten weiterführende Information. Dazu zählt die Webseite des Berlin Institut of Health genauso wie die zugehörigen Infos des Chipherstellers Intel. Darüber hinaus habe ich mit Gerhard Lesch ein Videogespräch über das Genom-Analyse-Projekt geführt, der hierfür seitens Intel zuständig war.
[Video] Mit Sentieon und Intel Genom-Daten deutlich schneller sequenzieren
Das vollständige Videointerview mit Prof. Christian Conrad
Disclaimer: Für das Verfassen und Veröffentlichen dieses Blogbeitrags hat mich die Firma Intel beauftragt. Bei der Ausgestaltung der Inhalte hatte ich nahezu freie Hand.