Sequenzierungen zu Identifikation von SARS-CoV-2 Virusmutationen sind für die Gesellschaft aktuell ein wichtiges Thema und sollen helfen, die Gefahr und Verbreitung des veränderten genetischen Codes des Virus zu verstehen. Bei natürlich auftretenden Mutationen des Virus-Genoms kann es z.B. zu höherer Infektiosität kommen. Am IBG-4 gehören Sequenzierungen und die nachfolgenden Analysen zum täglichen Handwerkszeug. Dabei wird das aktuell so wichtige Sequenzieren der SARS-CoV-2 Virusmutationen aber den Kollegen in der Medizin überlassen. Das Hauptinteresse unseres Institutsbereichs liegt in der Sequenzanalyse von Pflanzengenomen und der Einordnung der Sequenzen zu Funktionen und dem Zuordnen der entsprechenden Eigenschaften, die verschiedenen Pflanzen haben. So können dann die Sequenzen und die Kenntnis über sie vielfältig die Bioökonomie unterstützen.

Denn auch in Pflanzen können Mutationen, wie sie natürlichwerweise immer wieder zufällig auftauchen, Veränderungen verursachen, die dann Konsequenzen für z. B. die Qualität oder die Robustheit der Pflanzen zur Folge haben können. Dabei sind die inzwischen vorherrschenden Unterschiede in den Gensequenzen zwischen Pflanzen oft über viele Millionen Jahre entstanden und wurden in den letzten Jahrtausenden bei unseren Nutzpflanzen in der Züchtung gezielt ausgewählt. Durch Kreuzungen wurden bessere Zuchtlinien produzieret. Gezielte Genveränderungen durch verschiedene Methoden wie das Einbringen von Fremdgenen oder der Nutzung von sogenannten „Genscheren“, erlauben diesen Prozess erheblich zu beschleunigen und gerade die Genscheren bieten dabei ein präzises Werkzeug um gezielte kleine Mutationen einzubringen. Diese spielen aber derzeit aus regulatorischen Gründen leider in Deutschland eine untergeordnete Rolle.

Das SARS-CoV-2-Virus mutiert schnell, es werden viele Viruspartikel in den Körperzellen des Wirts in kurzer Zeit hergestellt und weiterverbreitet. Bei dem SARS-CoV-2-Virus liegt die Informationen des genetischen Codes in RNA-Bausteinen (RNA -Virus), die es mit einem eigenen besonderen Enzym „kopiert“. Normalerweise wird genetische Information in den allermeisten Lebewesen als DNA vervielfältigt und mithilfe von Enzymen, die ein sogenannte „proof-reading“-Funktion haben. Diese Kopier-Enzyme überprüfen ihre Arbeit gründliche und korrigieren sie gegebenenfalls und verhindern somit Fehler in der abgeschriebenen (kopierten) Sequenz weitestgehend. Die RNA-Kopiermaschine des RNA-Virus ist vergleichsweise schludrig und macht Fehler. So entstehen schnell falsch abgeschriebene Variationen des RNA-Stücks, das den Virus „kodiert“. Oft sind die Mutationen nicht von Bedeutung oder nicht vorteilhaft und setzen sich in den Folgegenerationen nicht durch, aber wenn es der Zufall will, ergeben sich eben zufällig „Verbesserungen“ für den Virus, er wird z.B. ansteckender – schlecht für uns, gut für den Virus und seine Verbreitung.

In Pflanzen wiederum sind ja Verbesserungen auch durch zufällige Mutationen grundsätzlich durchaus wünschenswert. So könnten durch Mutationen – ob zufällig entstanden oder z.B  auch gezielt mit den neuen Züchtungstechniken („Genschere“, CrispR/Cas) erzeugt – eben pflanzliche Produkte wie Früchte qualitativ verbessert werden, oder Erträge steigen und gegen extreme Klimabedingungen stabilisiert werden. Den jedem Organismus zugrunde liegenden Code zu lesen hilft, Unterschiede zwischen Pflanzen dann bestimmten Genabschnitten zuzuordnen und auch, gezielt Verbesserungen in der Pflanzenzüchtung auch durch klassische Kreuzungen zu planen und zu realisieren.

Wie kann man den Code lesen?

Der genetische Code ist aus vier verschiedenen DNA-Bausteinen aufgebaut, den Desoxynukleotiden diese sind im Grundgerüst immer gleich, sie bestehen aus einem Zucker mit einem Phosphatrest und tragen dann je eine von vier Basen. Die Variationen in diesen vier Basen kodieren die Organismen. Oft werden die Desoxynukleotide abgekürzt als A, C, G und T beschrieben, weswegen der genetische Code der eigentlich also aus langen Ketten von aneinanderhängenden Desoxynukleotiden besteht als lange scheinbar sinnlose Buchstabenfolgen beschrieben wird (s. Abbildung). Diese Desoxynukleotid-Reihenfolgen kann man aber z. B. den durch sie kodierten Eiweißstrukturen zuordnen und diesen dann wiederum bestimmte Funktionen in den Organismen. Das wird mit viel Forschung und auch mit bioinformatischen Programmen und Algorithmen wie sie am IBG-4 programmiert und regelmässig erweitert werden für viele DNA und Eiweißstrukturen bereits ermöglicht. Es sind aber noch lange nicht alle Funktionen von allen Genen bekannt.

Eine DNA Sequenz.
DNA Sequenz, die vier verschiedenen DNA-Bausteine sind als Buchstaben A, G, C, und T abgekürzt dargestellt.

Die Techniken des Sequenzierens haben in den letzten Jahrzehnten große Wandelungen durchlaufen.  Angefangen bei der Methode nach Sanger mit hohem Aufwand und geringem Durchsatz, die einem mühsamen Buchstabieren gleicht, die dann durch die Anwendung von Kapillarsystemen beschleunigt wurde. Inzwischen sind die Sequenzierungstechniken hochausgereift und Sequenzierungen können schnell und kostengünstig durchgeführt werden. Bei einer Genomaufklärung werden inzwischen statt einfach „vorne anzufangen“ oder kapitelweise vorzugehent in der Sequenzierung sehr schnell viele kleine Abschnitte gleichzeitig auf einmal gelesen. Das ist dann am Ende zwar dann zunächst ein großes Durcheinander, dieses kann aber mit den entsprechenden bioinformatischen Methoden effektiv und schnell sortiert werden kann. So ist das Sequenzieren inzwischen rasend schnell und auch deutlich kostengünstiger geworden.

Das erste Genom einer Pflanze, der eher unbekannten Ackerschmalwand (Arabidopsis thaliana) wurde im Jahr 2000 veröffentlicht. Dieses Unkraut wurde ausgewählt, weil es ein vergleichbar kleines Genom mit „nur“ 125 Millionen Basenpaaren hat. Eine Base wird in den Sequenzanalysen dann ja als ein Buchstabe dargestellt. Zum Vergleich: dieser Artikel ist mit ca. 8.500 Buchstaben geschrieben worden. Die Information zu Genomen ist also sehr umfangreich. Bei diesen frühen Sequenzanalysen zum Genom von Arabidopsis waren mehrere Arbeitsgruppen aus mehreren Ländern 10 Jahre lang beteiligt. Im Jahr 2000 wurde dann das komplette Genom veröffentlicht.

Arabidopsis thaliana –
Ackerschmalwand, die erste vollständig sequenzierte Pflanze. (Quelle, A. Wiese-Klinkenberg)

Heute geht die Sequenzierung und die anschliessende Analyse der Daten deutlich schneller. In dem Forschungsprojekt „1.001 Genomes“ wurden in 10 Jahren über tausend Ökotypen von Arabidopsis sequenziert und analysiert. Viele unserer Nutzpflanzen sind sozusagen schon „durchgelesen“ worden, inzwischen können viele Gen-Sequenzen schon ihrer Funktion in der Pflanze zugeordnet werden. Wissenschaftler am IBG-4 sind zum einen an der Sequenzierung von Nutzpflanzen und von verwandten Wildsorten beteiligt und haben zusätzlich mit der PlaBi-Datenbank (https://www.plabipd.de/) eine Gesamtübersicht der bereits veröffentlichten Pflanzengenome erschaffen in der man alle Pflanzengenome leicht finden und nutzen kann.

Aber wie nutzt das Sequenzieren jetzt der Bioökonomie?

Viele Produkte der Bioökonomie sind pflanzenbasiert. Das bedeutet, hier kann man durch Züchtung und Kenntnis von bestimmten Genabschnitten, die z.B. für die Produktion einer pharmazeutisch relevanten Substanz in Pflanzen wichtig sind, Verbesserungen in der Produktion dieser Substanz erreichen. Das kann durch die verstärkte Anreicherung der Substanz sein, aber auch durch Kenntnis und Verringerung von Substanzen, die eine Extraktion der Substanz erschweren. Natürlich ist allgemein die stabile und nachhaltige Produktion von Pflanzenprodukten ein wichtiger Bestandteil einer nachhaltigen Bioökonomie und so kann eine Resistenz gegen Pflanzenkrankheiten oder ‑schädlinge und eine allgemein verbesserte Robustheit gegen Umweltstresse bei Nutzpflanzen einen Mehrgewinn in der Bioökonomie und in der Nachhaltigkeit bedeuten. Vorteile sind dann ein ressourcenschonender und umweltfreundlicherer Anbau bei dem Pestizide und Pflanzenschutzmittel ausgelassen oder eingespart werden können.

Ein weiterer Forschungsbereich sind besondere pflanzliche Enzyme die, wenn man ihre Funktion erkennt und ihren genetischen „Code“ entschlüsselt hat, in anderen einfach zu kontrollierenden Organismen, wie zum Beispiel Bakterien, die man in großen Flüssigkulturen anziehen kann, biotechnologisch herstellen kann. Diese Bakterien, die dann das Pflanzen-Enzym produzieren,  können entweder selbst genutzt werden, damit sie mit Hilfe des fremden Enzyms eine Umwandlung von Substanzen in andere Zielsubstanzen durchführen, oder die Enzyme können aus ihnen herausgelöst werden und in der Umwandlung von Substanzen eingesetzt werden.

So kann der abgelesen und verstandene „genetische Code“, der die verschiedenen Pflanzen ausmacht, für bioökonomische Arbeiten genutzt werden. Den Code zu lesen und zu verstehen hilft also vielfältig, Pflanzen für die Bioökonomie zu nutzen und zu verbessern.

About IBG-4 Bioinformatik

Der Institutsbereich Bioinformatik IBG-4 entwickelt Methoden um komplexe Datensätze und Prozesse aus dem Bereich der Bioökonomie und der Pflanzenwissenschaft durch wissensbasierte Datenintegration, klassische Bioinformatik und maschinelles Lernen zu untersuchen und optimieren. Mit benutzerfreundlichen Datenbanken, neuen Methoden zur Genomanalyse und Lösungen zur Integration, Interpretation und Darstellung großer Datensätze sollen Pflanzen, andere Organismen und Gene für eine nachhaltige bioökonomische Nutzung erschlossen oder verbessert werden. Der Institutsbereich Bioinformatik IBG-4 ist Mitglied im Forschungsverbund Bioeconomy Science Center.

No Comments

Be the first to start a conversation

Leave a Reply

  • (will not be published)