Navigation und Service

Forschungsdaten

Einleitung/Aktuelles

Um die Nutzung der Krebsregisterdaten für die Forschung zu fördern, stellt das Zentrum für Krebsregisterdaten (ZfKD) die Daten der Krebsregister Dritten auf Antrag zur Verfügung. Hierbei muss ein wissenschaftliches Interesse nachgewiesen werden.

Aktuell können Daten aus zwei unterschiedlichen Datensätzen beantragt werden,

Die beiden Datensätze unterscheiden sich in ihrer Struktur und im Umfang der enthaltenen Variablen. Eine Datensatzbeschreibung ist unter dem jeweiligen Menüpunkt verlinkt. Der klinische Datensatz geht auf eine Anpassung des Bundeskrebsregisterdatengesetzes (BKRG) im August 2021 zurück und soll mittelfristig den „alten“, rein epidemiologischen Datensatz ablösen.
Bitte beachten Sie: Die klinischen Daten sind erst ab Diagnosejahr 2020 verfügbar und liegen derzeit noch nicht aus allen Registern vor (Stand: 8. November 2023).

Wir gehen davon aus, dass bis Jahresende 2023 klinische Daten aus allen Krebsregistern am ZfKD eingetroffen und auf formale Konsistenz überprüft worden sind.
Der epidemiologische Datensatz steht weiterhin auch für Diagnosejahre vor 2020 zur Verfügung. Allerdings enthält er keine Therapieangaben mehr, weil diese mit den detaillierteren Angaben im klinischen Datensatz nicht vergleichbar wären.

Aufbau des klinischen Datensatzes

Die klinischen Daten werden nicht – wie die „alten“, epidemiologischen Daten – in einer einfachen „Rechtecktabelle“ abgebildet, in der Erkrankungsfälle als Zeilen und Variablen als Spalten dargestellt sind. Sie werden in einem XML-Schema wiedergegeben, das für die Darstellung komplexer, verschachtelter Daten besser geeignet ist.
Der klinische Datensatz wird durch folgende Elemente strukturiert:

  • Die Person bildet die grundlegende Einheit im Datensatz.
  • Der Person zugeordnet ist mindestens ein Element Tumor.
  • Das Element Tumor enthält ein verpflichtendes Element Primärdiagnose. Darüber hinaus sind dem Element Tumor mehrere optionale Elemente zugeordnet, in denen Angaben zur Behandlung (Elemente OP, ST und SYST) und zu Folgeereignissen (Element Folgeereignis) wie Remissionen und Rezidive erfasst werden können.
  • Das Element Primärdiagnose enthält u.a. Angaben zum Tumorstadium, zur Histologie und Lokalisation des Tumors.

Die Elemente Primärdiagnose, Folgeereignis, OP, ST und SYST können für den jeweiligen Tumor mehrfach verwendet werden, so dass auch komplexe Krankheitsverläufe abgebildet werden können.

Die Struktur des klinischen Datensatzes ist vereinfacht in Abbildung 1 wiedergegeben.

Abb.1: Vereinfachtes Datenschema (mit ausgewählten Variablen) Abb.1: Vereinfachtes Datenschema (mit ausgewählten Variablen)

Die Inhalte eines Elements können in ein tabellarisches Format überführt und über eine fallbezogene Nummer mit anderen Tabellen aus dem Datensatz verknüpft werden. Auf diese Weise entsteht ein auswertbares Format, in dem die bewilligten Daten an den Datenempfänger übermittelt werden können (beispielsweise als CSV-Datei).

Plausibilität und weitere Qualitätsmerkmale

Die Daten werden in den Registern auf Plausibilität geprüft und weitgehend um Widersprüche bereinigt. Nach Übermittlung der Daten ans ZfKD wird mit einem etablierten Verfahren ihre Vollzähligkeit geschätzt. Nach den Erfahrungen aus den letzten Jahren ist seit etwa 2015 und auch nach der Umstellung auf die klinische Krebsregistrierung bundesweit von einer hohen Vollzähligkeit der Erfassung (höher als 90 Prozent) auszugehen. Ob dies auch für das Diagnosejahr 2021 zutrifft, ist noch nicht abzusehen.
Als eine der Bedingungen für die Finanzierung der Krebsregister durch die Krankenkassen wurden Mindestkriterien für die Vollständigkeit bestimmter Variablen (beispielsweise Tumorstadien) festgelegt, die zuletzt von allen Registern erfüllt wurden.

Verfahren für die Schätzung der Vollzähligkeit gemeldeter Therapien und Folgeereignisse müssen erst etabliert werden. Das ZfKD kann daher zunächst keine fundierte Einschätzung darüber abgeben, wie vollständig tumorbezogene Therapien im Verlauf einer Behandlung von den Behandlern gemeldet und entsprechend im Datensatz erfasst wurden. Insbesondere für Verlaufsereignisse und Therapieänderungen ist nicht davon auszugehen, dass diese bereits für alle Diagnosen und in jeder Region vollzählig gemeldet werden. Dies könnte nach ersten Erfahrungen aus den Registern vor allem Meldungen aus dem ambulanten Bereich betreffen. Diese Limitation ist bei Auswertungen zwingend zu beachten.

Das ZfKD wird gemeinsam mit den Registern Methoden entwickeln, die zumindest eine qualitative Einschätzung dieser Qualitätsaspekte erlauben. Interessierte, die klinische Daten beantragen und für eigene Auswertungen nutzen wollen, sollten einplanen, diese Aspekte mit klinischer Expertise kritisch zu prüfen bzw. bewerten zu lassen, um Fehlinterpretationen zu vermeiden.

Wie können die Daten beantragt werden?

Die Voraussetzungen für die Nutzung der am ZfKD vorliegenden Datensätze sind unter dem Menüpunkt Informationen zur Antragstellung beschrieben. Dort erhalten Sie auch Informationen zu möglicherweise anfallenden Gebühren und Auslagen.

Wie werden beantragte Daten bereitgestellt?

Die Zugangswege für die Nutzung des klinischen Datensatzes hängen von der Einschätzung des Reidentifikationsrisikos ab. Dieses wird individuell für jeden Datennutzungsantrag vom ZfKD geprüft. In diese Prüfung wird auch der wissenschaftliche Ausschuss des ZfKD einbezogen.

Kriterien für die Prüfung des Reidentifikationsrisikos werden derzeit entwickelt. Wird das Risiko, dass mittels der beantragten Daten ein Personenbezug hergestellt werden kann, als gering eingeschätzt, werden die beantragten Daten in einem für das Projekt geeigneten Format übermittelt. Im anderen Fall trifft das ZfKD Maßnahmen, um das Reidentifikationsrisiko zu senken. Diese Maßnahmen können darin bestehen, dass bestimmte Variablen (beispielsweise Alter und Wohnort) vergröbert werden oder dass anstelle von Einzelfalldaten aggregierte Ergebnismengen bereitgestellt werden. Falls solche Maßnahmen nicht ausreichen oder das Forschungsvorhaben zu sehr einschränken würden, sollen Auswertungen in einer kontrollierten Analyseumgebung ermöglicht werden. Das RKI prüft derzeit die technische Umsetzung solcher Lösungen.

Ist eine Zusammenführung mit anderen Daten erlaubt?

Die Datensätze des ZfKD enthalten keine direkt identifizierenden Merkmale (beispielsweise Versicherungsnummern). Auch andere Merkmale der Daten (beispielsweise Geburtsmonat/-jahr, Kreiskennziffer, Geschlecht) dürfen nicht dazu genutzt werden, diese auf Einzelfallebene mit anderen Datenbeständen zu verknüpfen (sogenanntes Record Linkage) und auf diese Weise einen Personenbezug herzustellen.

Erlaubt ist die Zusammenführung von Ergebnismengen mit Bevölkerungsdaten oder anderen regionalstatistischen Informationen, wie sie in epidemiologischen Auswertungen üblich ist. Ist eine solche Zusammenführung vorgesehen, ist im Datennutzungsantrag darauf einzugehen. Bei der Publikation von Ergebnissen ist sicherzustellen, dass keine Schlussfolgerungen auf einzelne Personen möglich sind.

Wo erhalte ich Informationen zu bewilligten Datennutzungsanträgen?

Zur Erhöhung der Transparenz über die wissenschaftliche Nutzung der Krebsregisterdaten wurde ein öffentliches Antragsverzeichnis eingerichtet, in dem Informationen über bewilligte Datennutzungsanträge bereitgestellt werden. Jeder Eintrag im Verzeichnis erhält einen permanenten Identifikator (digital object identifier, DOI). Dieser kann von Datenempfängern genutzt werden, um beispielsweise in Publikationen auf den Eintrag im Verzeichnis zu verweisen.
Bei Interesse können im Verzeichnis weitere Angaben zu den Projekten (statistische Analysepläne, Angaben zur Finanzierung des Projekts o.ä.) veröffentlicht werden.

Wie können Daten der Landeskrebsregister beantragt werden?

Grundsätzlich können über das ZfKD auch Daten der Landeskrebsregister beantragt werden. Dies empfiehlt sich insbesondere für regional landesspezifische Projekte oder für solche, die auf Informationen zu behandelnden Einrichtungen oder auf andere am ZfKD nicht verfügbare Daten angewiesen sind. Bei der Beantragung von Daten der Landeskrebsregister ist zu beachten, dass sich die Möglichkeiten und Antragsbedingungen von Land zu Land leicht unterscheiden.

Stand: 08.11.2023

Zusatzinformationen

Datenbankabfrage

Datenbankabfrage

Hier haben Sie die Möglichkeit, eigene Abfragen zu aktuellen Neuerkrankungs- und Sterberaten zu starten.