Datenanalyse-Hilfsmittel

Omics-Workflows

Das GHGA-Bioinformatik-Team arbeitet kontinuierlich daran, standardisierte, vergleichbare und reproduzierbare Omics-Workflows (standardisierte Abläufe für die Datenanalyse) für die Forschungsgemeinschaft bereitzustellen. In enger Zusammenarbeit mit der nf-core-Gemeinschaft verbessern wir bestehende Workflows und entwickeln Best-Practices für Reproduzierbarkeit und Zuverlässigkeit. Dies ermöglicht Forschenden und Kliniker*innen, komplexe Omics-Daten effizient und präzise zu analysieren. Im Folgenden stellen wir die bereits publizierten Workflows vor, an denen GHGA beteiligt war.

Für Einsteiger empfehlen wir Bytesize  - eine von nf-core veröffentlichte Video-Tutorial-Serie, die eine leicht verständliche Einführung in die Anwendung von nf-core Workflows bietet

Benchmarking

Ein kontinuierliches Benchmarking, also der Vergleich von Arbeitsabläufen anhand bekannter Standards, ist entscheidend für die Präzision und Zuverlässigkeit von Workflows und ein zentraler Bestandteil der Qualitätssicherung in der Bioinformatik. GHGA trägt zu verschiedenen Benchmarking-Bemühungen bei, die darauf abzielen, die Leistung und Genauigkeit bioinformatischer Workflows zu bewerten.. 

Ein Beispiel ist NCBench, eine gemeinsam mit dem Next Generation Sequencing Competence Network (NGS-CN) entwickelte Plattform für das kontinuierliche Benchmarking von Workflows zur Bestimmung genomischer Varianten. NCBench bietet einen umfassenden und reproduzierbaren Benchmarking-Workflow zur Bewertung kleiner genomischer Variantenbestimmungen in Bezug auf Präzision und falsch positiver/negativer Fehlermuster. Der kontinuierliche Open-Source-Ansatz macht eine spezielle Infrastruktur überflüssig und Benchmarking damit für die Forschungs- und Diagnostikgemeinschaft, aber auch für Patient:innen, zugänglich und transparent.

Logo für nf-core sarek: grüne geometrische Form innerhalb eines weißen Kreises, umgeben von einem schwarzen Kreis

sarek 3.0

Pipeline zur Bestimmung von somatischen und Keimbahn-Varianten von nf-core - GHGA entwickelt und testet einen Leitfaden und eine Konfiguration für die harmonisierte Bestimmung von Varianten mit öffentlichen Ressourcen und Analyseparameter-Einstellungen.

Mehr erfahren
Icon für DNA-Analyse-Workflows: Orangefarbene Doppelhelix, umgeben von einem halbkreisförmigen dunkelgrünen Bogen

nanoseq 3.0

Methode zur Analyse von Long-Read-Sequenzierung von nf-core mit Schwerpunkt auf der Oxford Nanopore-Technologie - GHGA entwickelt und testet einen Leitfaden und eine Konfiguration für harmonisiertes Long-Read-Alignment und QC.

Mehr erfahren
Logo für DROP: Sechseckige Form mit violettem Rand, die das Wort „Drop“ zeigt, gebildet aus RNA-Sequenzelementen und Basenpaarungen

DROP

Snakemake Pipeline zur Erkennung von abweichenden RNA-Ereignissen - Eine Methode zur Verarbeitung und Interpretation von RNA-Seq-Daten sowie zur Erkennung von Abweichungen bei Seltenen Erkrankungen, z.B. Änderungen in Spleißen und Expressionsleveln.

Mehr erfahren
Icon für DNA-Analyse-Workflows: Orangefarbene Doppelhelix, umgeben von einem halbkreisförmigen dunkelgrünen Bogen

nf-platypusindelcalling

Eine Nextflow-basierte Pipeline zum Erkennen und Priorisieren von somatischen Indels mit umfangreichen Qualitätskontroll- und Filterungsschritten. Weiterentwickelt aus der Roddy-Pipeline, die in der Pan-Krebs-Analyse von ganzen Genomen verwendet wurde.

Mehr erfahren
Icon für DNA-Analyse-Workflows: Orangefarbene Doppelhelix, umgeben von einem halbkreisförmigen dunkelgrünen Bogen

nf-snvcalling v2.0

Nextflow-Pipeline zum Erkennen und Priorisieren von somatischen Einzelnukleotid-Variationen mit Filtermöglichkeiten, Annotationen und Diagrammen. Weiterentwickelt aus der Roddy-Pipeline, die in der Pan-Krebs-Analyse von ganzen Genomen verwendet wurde.

Mehr erfahren
Icon für DNA-Analyse-Workflows: Orangefarbene Doppelhelix, umgeben von einem halbkreisförmigen dunkelgrünen Bogen

nf-aceseq vdev

Nextflow-Pipeline zur Schätzung allelspezifischer Kopienzahlen anhand humaner Ganzgenomsequenzierungsdaten (>30X). Weiterentwickelt aus der Roddy-Pipeline, die in der Pan-Krebs-Analyse von ganzen Genomen verwendet wurde.

Mehr erfahren
Icon für RNA-Analyse-Workflows: Grüner RNA-Strang, umgeben von einem halbkreisförmigen orangefarbenen Bogen“

rnaseq 3.0

Pipeline zur Analyse von RNA-Sequenzierungsdaten von nf-core - GHGA entwickelt und testet einen Leitfaden und eine Konfiguration für harmonisierte RNA-seq-Analysen und Genexpressionsschätzungen mit öffentlichen Ressourcen und Einstellungen.

Mehr erfahren
Icon für RNA-Analyse-Workflows: Grüner RNA-Strang, umgeben von einem halbkreisförmigen orangefarbenen Bogen“

scrnaseq 2.0

10XGenomics Pipeline für Einzelzell-RNA-Sequenzdaten von nf-core - GHGA entwickelt und testet einen Leitfaden und eine Konfiguration für die harmonisierte Analyse und Genexpressionsabschätzung mit öffentlichen Ressourcen und Einstellungen.

Mehr erfahren
Icon für DNA-Analyse-Workflows: Orangefarbene Doppelhelix, umgeben von einem halbkreisförmigen dunkelgrünen Bogen

nf-core/variantbenchmarking v1.0

Benchmarking-Pipeline zur Bestimmung von für Keimbahn- und somatische Varianten - GHGA ist der Hauptentwickler dieser nf-core-Pipeline.

Mehr erfahren
Icon für RNA-Analyse-Workflows: Grüner RNA-Strang, umgeben von einem halbkreisförmigen orangefarbenen Bogen“

nf-core/spatialxe vdev

Best-Practice-Pipeline für die Vorverarbeitung und Qualitätskontrolle von Xenium-Daten für die räumliche Profilierung in situ - GHGA ist der Hauptentwickler dieser nf-core-Pipeline.

Mehr erfahren
Icon für DNA-Analyse-Workflows: Orangefarbene Doppelhelix, umgeben von einem halbkreisförmigen dunkelgrünen Bogen

Genomrechenzentrum (GRZ) QC Workflow vdev

Best-Practice-Pipeline zur Qualitätskontrolle von Short- und Long-Read-Sequenzierungsdaten. Diese Pipeline wird im Modellvorhaben GenomSeq verwendet.

Mehr erfahren