GHGA Datenknoten

 

Die GHGA Datenknotenpunkte oder Data Hubs befinden sich an sieben großen GHGA-Standorten in ganz Deutschland: am DKFZ in Heidelberg, an der Universität Tübingen, an den Technischen Universitäten in München und Dresden (TUM und TUD), an der Universität zu Köln, am MDC in Berlin und an der Universität Kiel.

Sobald das GHGA-Datenportal in Betrieb ist, wird es als zentrale Anlaufstelle für den Up- und Download und die Analyse von Genomdaten dienen. Hinter den Kulissen wird diese "zentrale" Seite von GHGA von sieben Datenknotenpunkten bedient, die als föderiertes Netzwerk arbeiten.

Die Datenknotenpunkte (Data Hubs) sind mit lokalen, gut etablierten Omics-Zentren (z. B. Sequenzierzentren, aber auch Proteomics-Einrichtungen) verbunden. Diese generieren einen bedeutenden Teil der Omics-Daten und der zugehörigen technischen Metadaten in Deutschland und sind daher wichtige Datenlieferanten für GHGA. 

Die Hubs stellen Speicher- und Recheninfrastruktur für die GHGA-Dienste zur Verfügung. Zusätzlich bieten sie Ressourcen, professionellen Betrieb, technische Sicherheit und Skalierbarkeit für GHGA. Ein großer Vorteil dieses Datenhub-Netzwerks ist, dass es Replikationsdienste zwischen den Datenhubs einrichten wird - mit geo-redundantem Speicher und Backup an jedem Datenhub.

Die ursprünglich unterschiedlichen Konfigurationen der Hubs werden derzeit zu einer gemeinsamen Infrastruktur zusammengeführt. Der Datenknoten am DKFZ in Heidelberg übernimmt dabei eine Führungsrolle und wird zentrale Dienste anbieten, die für die Realisierung der föderierten GHGA-Infrastruktur erforderlich sind.