Frequently Asked Questions

GHGA ist das Deutsche Humangenom-Phänomarchiv. Seit Ende 2020 bauen wir eine sichere nationale Infrastruktur für Omics-Daten auf. GHGA bietet eine sichere Plattform für den Datenaustausch und die Sekundärnutzung von humanen Genomdaten aus Forschung und klinischer Sequenzierung.

Erfahren Sie hier mehr über GHGA’s Mission.

Das GHGA-Datenportal ist die zentrale Anlaufstelle für den Up/Download und die Analyse von Omics-Daten. Physisch werden die Daten aber auf föderierte Weise lokal auf Servern der GHGA Datenknoten gespeichert.  

Die GHGA Datenknoten sind mit deutschen Universitäten und Forschungszentren - den Hauptproduzenten von humanen Omics-Daten - verbunden. Als föderiertes Netzwerk nutzen sie gemeinsame Standards und Infrastrukturen. Koordiniert werden die Datenknoten durch die GHGA Zentrale, repräsentiert durch das DKFZ.

GHGA ist bestrebt, die Erwartungen und Bedenken der Patient:innen zu verstehen. Wir haben beratende Foren abgehalten, um ihre Ansichten über eine transparente und vertrauenswürdige Verwaltung von GHGA einzuholen. GHGA arbeitet an der Einbindung eines Patient:innenrats innerhalb der GHGA Verwaltungsstruktur, für einen kontinuierlichen Austausch von Ideen und Perspektiven zu Fragen rund um Omics-Daten und Forschung. Die Patient:innen - und nicht nur ihre Daten - sollen zu einem integralen Bestandteil des Wachstums und der Entwicklung der GHGA werden.

GHGA ist als föderiertes Netzwerk organisiert - unter zentraler Verwaltung werden die Daten lokal an den GHGA-Dateknoten gespeichert. 

Die Datenknoten stellen Speicher- und Recheninfrastruktur für die GHGA-Dienste zur Verfügung. Zusätzlich bieten sie Ressourcen, professionellen Betrieb, Datenverwaltung,  technische Sicherheit und Skalierbarkeit für GHGA. Ein großer Vorteil dieses Netzwerks ist, dass es Replikationsdienste zwischen den Datenknotenpunkten einrichtet - so werden perspektivisch geo-redundanter Speicher und Backup an jedem Knotenpunkt angeboten.

Im Juni 2022 unterzeichnete GHGA, repräsentiert durch  das DKFZ als koordinierende juristische Instanz, eine Kooperationsvereinbarung mit EGA, wodurch GHGA zum deutschen nationalen Knotenpunkt der föderierten EGA wurde. Mehr hier.

GDI zielt darauf ab, die Mission der 1+MG-Initiative zu verwirklichen und nationale Genomdateninfrastrukturen in ganz Europa zu einem Netzwerk zu verbinden. GHGA bildet den deutschen GDI-Knotenpunkt und wird  somit an die paneuropäische GDI-Infrastruktur angebunden. Mehr hier.

Genomsequenzierung in die Regelversorgung zu bringen und gleichzeitig die bestmögliche Nutzung der generierten Daten für Forschungszwecke zum Wohle zukünftiger Patienten zu gewährleisten. Das ist das Ziel von genomDE

Ein Baustein ist die Schaffung einer zuverlässigen Infrastruktur für Genomdaten, in der die Forschungsdaten sicher archiviert und gemeinsam genutzt werden können. Gemeinsam mit den Partnereinrichtungen des genomDE-Projekts entwickelt GHGA technische und rechtliche Lösungen für die Archivierung und Sekundärnutzung von Daten aus dieser nationalen Genominitiative.

Nutzung von GHGA

Das GHGA-Datenportal befindet sich momentan in der Entwicklungsphase. In Zukunft wird der Daten-Upload über ein Online-Portal möglich sein. Wir werden die Communities  benachrichtigen, sobald diese Funktion voll funktionsfähig ist.

Während der Phase des "GHGA Metadata Catalog" arbeiten wir mit ausgewählten Partnerinstitutionen zusammen, um erste Datensätze zur Verfügung zu stellen. Wenn Sie an einem GHGA-Partnerinstitut angesiedelt sind und Ihre Metadaten in den GHGA Metadata Catalog hochladen möchten, wenden Sie sich bitte an das GHGA Helpdesk.

Mit Hilfe des GHGA Metadata Catalog können die in GHGA verfügbaren Daten gesucht werden. Wenn Sie Datensätze gefunden haben, die Sie interessieren, können Sie sich über die angezeigten Kontaktinformationen mit den für die Datensätze verantwortlichen Personen in Verbindung setzen. 

Sobald die Zugangsanfragen von den Verantwortlichen genehmigt wurden, werden die Daten zugänglich gemacht. Derzeit sind hierfür  Ressourcen außerhalb von GHGA nötig, z. B. bestehende lokale Omics  Infrastrukturen. Der Datenzugang wird in Zukunft direkt von der GHGA verwaltet.

Innerhalb von GHGA können nur humane Omics-Daten archiviert werden. Dazu gehören Sequenzierungs-Rohdaten, zugehörige Metadaten oder jede Art von humanen Omics-Daten. Die meisten Dateiformate werden dabei unterstützt. Datensätze, die bei GHGA eingereicht werden sollen, müssen anhand des GHGA Metadatenschemas beschrieben werden, das auf GitHub verfügbar ist. Weitere Erläuterungen finden sich in dem GHGA Metadata Positionspapier auf Zenodo (englischsprachig).

Für Daten aus nicht-humanen Modellsystemen, die nicht der geregelten Zugriffskontrolle unterliegen, empfehlen wir, spezielle Archive wie das European Nucleotide Archive (ENA) zu nutzen. 
Bitte wenden Sie sich an den 
GHGA Helpdesk, wenn Sie Daten einreichen oder spezielle Fragen haben.

GHGA setzt  einen ethisch-rechtlichen Rahmen um, der auf die deutsche Rechtslage und die Auslegung der Datenschutz-Grundverordnung zugeschnitten ist - etwas, das andere internationale Initiativen nicht garantieren können. Dies macht GHGA besonders für deutsche Datenproduzent:innen nützlich.

Da GHGA Teil des fEGA ist, sind die im deutschen Knoten hinterlegten Daten in fEGA auffindbar. Daher werden der Nutzen und die Vorteile der regelmäßigen EGA-Übermittlungen beibehalten, wenn Daten in GHGA hinterlegt werden.

Während die Einreichung von Daten bei GHGA nicht auf deutsche Forschende oder Institutionen beschränkt ist, empfehlen wir europäischen Forschenden, den föderalen EGA-Knoten ihres eigenen Landes zu nutzen. Innerhalb der fEGA können europäische Datensätze, die an den nationalen Knotenpunkten gespeichert sind, in einer zentralen Datenbank gefunden werden.

Als Partner des föderierten European Genome-Phenome Archive (fEGA) und der European Genomics Data Infrastructure (GDI) werden die in GHGA gesammelten Daten international auffindbar sein. 

Darüber hinaus wollen wir durch die Verwendung gemeinsamer technischer und Metadaten- Standards die Interoperabilität der gesammelten Daten mit Datensätzen in aller Welt sicherstellen. Der Zugang zu den Daten unterliegt jedoch weiterhin der nationalen Auslegung der Datenschutz-Grundverordnung.

Data security and protection

GHGA will Datenmissbrauch verhindern. Um Datensicherheit zu gewährleisten, verfolgen wir einen mehrschichtigen Ansatz. Das neu entwickelte Datenportal bietet ein hohes Maß an Cybersicherheit auf der Grundlage von Zero-Trust-Networking. Kombiniert mit technischen und organisatorischen Maßnahmen, werden Daten so sicher archiviert und können gemeinsam genutzt werden.

Darüber hinaus haben  wir einen Rahmen für die DSGVO-konforme Datenverarbeitungentwickelt und helfen den Datenproduzent:innen, die Patient:innen zu informieren und ihre Einwilligung einzuholen und zu verwalten. Ein kontrollierter, aber dennoch FAIRer Datenzugriff ist die letzte Ebene, um Daten zu schützen und gleichzeitig ihr Potenzial für die Forschung auszuschöpfen.

Weder gehören GHGA die Daten, noch ist GHGA für die hinterlegten Daten verantwortlich. GHGA fungiert als Datenverarbeiter, der die Daten nach Anweisung der Datenverantwortlichen verarbeitet und teilt. 

GHGA kann daher Daten nur dann an andere Forschende (Datenanforderer) weitergeben, wenn die Datenverantwortlichen ausdrücklich zugestimmt haben. Anfragen auf Datenzugriff können über GHGA als Mittler gestellt werden. Es obliegt jedoch dem Datenverantwortlichen, individuell über diese Anfragen zu entscheiden.

Nur nicht-personenbezogene Metadaten sind im GHGA Datenportal öffentlich zugänglich. 

Forschende, die archivierte Daten nutzen oder personenbezogene Metadaten einsehen möchten, müssen einen Antrag auf Zugang beim zuständigen Datenverantwortlichen stellen. 

Ein Data Access Committee, DAC oder eine vergleichbare Instanz prüft die Rechtmäßigkeit des Antrags, bevor der Zugang gewährt wird. Durch diesen Schritt wird sichergestellt, dass nur Forschende mit einer validen Forschungsfrage Zugang zu sensiblen Daten erhalten - eine weitere Schutzebene.

GHGA hat verschiedene Instrumente entwickelt, um Nutzer:innen dabei zu unterstützen, Omics-Daten in einer rechtlich und ethisch einwandfreien Weise an GHGA zu übermitteln. 

Wir haben Module entwickelt, die in bestehende oder neu verfasste Einwilligungserklärungen aufgenommen werden können. Eine App hilft bei der Bewertung, ob Einwilligungserklärungen aus der Zeit vor der Datenschutz-Grundverordnung für eine neue Datenverarbeitung ausreichen.