Skip to content

This repository contains the code for the manuscript Ensemble-labeling of infectious diseases time series to evaluate early warning systems with which you can reproduce the manuscript's results and figures.

License

Notifications You must be signed in to change notification settings

RKIOpenData/OpenData_Sandbox

Repository files navigation

Datensatzdokumentation

OpenData_Sandbox: Testdokumentation


Robert Koch-Institut | RKI
Nordufer 20
13353 Berlin



Zitieren

Name, V. (2025). Open Data Sandbox [Data set]. Zenodo. https://doi.org/10.5072/zenodo.166598

Inhaltsverzeichnis

Beispieltext

Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Aenean commodo ligula eget dolor. Aenean massa. Cum sociis natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Donec quam felis, ultricies nec, pellentesque eu, pretium quis, sem.

Nulla consequat massa quis enim. Donec pede justo, fringilla vel, aliquet nec, vulputate eget, arcu. In enim justo, rhoncus ut, imperdiet a, venenatis vitae, justo. Nullam dictum felis eu pede mollis pretium. Integer tincidunt. Cras dapibus. Vivamus elementum semper nisi. Aenean vulputate eleifend tellus. Aenean leo ligula, porttitor eu, consequat vitae, eleifend ac, enim. Aliquam lorem ante, dapibus in, viverra quis, feugiat a,

Formatierungstests

Links

Link: Robert Koch-Institut

Email

Email: [email protected]

Aufzählungen

  • Punkt 1
  • Punkt 2
  1. Punkt 1
  2. Punkt 2

Mathematische Formeln

Block

$$ Gene_{normalisiert} = {Q_{KA_aktuell}}/{Q_{KA_median}} \cdot Gene_{gemittelt} $$

Inline
  • $Q_{KA_median}$ : Median des Volumenstrom der Kläranlage

Variablen und Werte

Die Datei Sandbox_Data.tsv enthält die in der folgenden Tabelle abgebildeten Variablen und deren Ausprägungen. Ein maschinenlesbares Datenschema ist im Data Package Standard in tableschema_Sandbox_Data.json hinterlegt:

tableschema_Sandbox_Data.json

Variable Typ Ausprägungen Beschreibung
A integer Werte: 1 Dataset Variable A
B number Werte: 1 Dataset Variable B

Die Datei Sandbox_Data_lfs.tsv enthält die in der folgenden Tabelle abgebildeten Variablen und deren Ausprägungen. Ein maschinenlesbares Datenschema ist im Data Package Standard in tableschema_Sandbox_Data_lfs.json hinterlegt:

tableschema_Sandbox_Data_lfs.json

Variable Typ Ausprägungen Beschreibung
A integer Werte: 1 Dataset Variable A
B number Werte: 1 Dataset Variable B

Metadaten

Zur Erhöhung der Auffindbarkeit sind die bereitgestellten Daten mit Metadaten beschrieben. Über GitHub Actions werden Metadaten an die entsprechenden Plattformen verteilt. Für jede Plattform existiert eine spezifische Metadatendatei, diese sind im Metadatenordner hinterlegt:

Metadaten/

Versionierung und DOI-Vergabe erfolgt über Zenodo.org. Die für den Import in Zenodo bereitgestellten Metadaten sind in der zenodo.json hinterlegt. Die Dokumentation der einzelnen Metadatenvariablen ist unter https://developers.zenodo.org/#representation nachlesbar.

Metadaten/zenodo.json

In der zenodo.json ist neben dem Publikationsdatum ("publication_date") auch der Datenstand in folgendem Format enthalten (Beispiel):

  "dates": [
    {
      "start": "2023-09-11T15:00:21+02:00",
      "end": "2023-09-11T15:00:21+02:00",
      "type": "Collected",
      "description": "Date when the Dataset was created"
    }
  ],

Hinweise zur Nachnutzung der Daten

Offene Forschungsdaten des RKI werden auf Zenodo.org, GitHub.com, OpenCoDE und Edoc.rki.de bereitgestellt:

Lizenz

Der Datensatz "Open Data Sandbox" ist lizenziert unter der Creative Commons Namensnennung 4.0 International Public License | CC-BY 4.0 International.

Die im Datensatz bereitgestellten Daten sind, unter Bedingung der Namensnennung des Robert Koch-Instituts als Quelle, frei verfügbar. Das bedeutet, jede Person hat das Recht die Daten zu verarbeiten und zu verändern, Derivate des Datensatzes zu erstellen und sie für kommerzielle und nicht kommerzielle Zwecke zu nutzen. Weitere Informationen zur Lizenz finden sich in der LICENSE bzw. LIZENZ Datei des Datensatzes.

Appendix

Dies ist ein Beispiel-Appendix 📂.

Data set documentation

OpenData_Sandbox: Test documentation


Robert Koch-Institut | RKI
Nordufer 20
13353 Berlin



Citation

Name, V. (2025). Open Data Sandbox [Data set]. Zenodo. https://doi.org/10.5072/zenodo.166598

Table of contents

Example text

Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Aenean commodo ligula eget dolor. Aenean massa. Cum sociis natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Donec quam felis, ultricies nec, pellentesque eu, pretium quis, sem.

Nulla consequat massa quis enim. Donec pede justo, fringilla vel, aliquet nec, vulputate eget, arcu. In enim justo, rhoncus ut, imperdiet a, venenatis vitae, justo. Nullam dictum felis eu pede mollis pretium. Integer tincidunt. Cras dapibus. Vivamus elementum semper nisi. Aenean vulputate eleifend tellus. Aenean leo ligula, porttitor eu, consequat vitae, eleifend ac, enim. Aliquam lorem ante, dapibus in, viverra quis, feugiat a,

Formatting tests

Links

Link: Robert Koch-Institut

Email

Email: [email protected]

Bullet points

  • Point 1
  • Point 2
  1. Point 1
  2. Point 2

Mathematical formulae

Block

$$ Gene_{normalized} = {Q_{KA_current}}/{Q_{KA_median}} \cdot Gene_{averaged} $$

Inline
  • $Q_{KA_median}$ : Median of the volume flow of the wastewater treatment plant

Variables and Values

The file Sandbox_Data.tsv contains the variables and their values shown in the following table. A machine-readable data schema is stored in Data Package Format in tableschema_Sandbox_Data.en.json:

tableschema_Sandbox_Data.en.json

Variable Type Characteristic Description
A integer Values: 1 Dataset Variable A
B number Values: 1 Dataset Variable B

The file Sandbox_Data_lfs.tsv contains the variables and their values shown in the following table. A machine-readable data schema is stored in Data Package Format in tableschema_Sandbox_Data_lfs.en.json:

tableschema_Sandbox_Data_lfs.en.json

Variable Type Characteristic Description
A integer Values: 1 Dataset Variable A
B number Values: 1 Dataset Variable B

Metadata

To increase findability, the provided data are described with metadata. The Metadata are distributed to the relevant platforms via GitHub Actions. There is a specific metadata file for each platform; these are stored in the metadata folder:

Metadaten/

Versioning and DOI assignment are performed via Zenodo.org. The metadata prepared for import into Zenodo are stored in the zenodo.json. Documentation of the individual metadata variables can be found at https://developers.zenodo.org/representation.

Metadaten/zenodo.json

The zenodo.json includes the publication date and the date of the data status in the following format (example):

  "publication_date": "2024-06-19",
  "dates": [
    {
      "start": "2023-09-11T15:00:21+02:00",
      "end": "2023-09-11T15:00:21+02:00",
      "type": "Collected",
      "description": "Date when the Dataset was created"
    }
  ],

Guidelines for Reuse of the Data

Open data from the RKI are available on Zenodo.org, GitHub.com, OpenCoDE, and Edoc.rki.de:

License

The "Open Data Sandbox" dataset is licensed under the Creative Commons Attribution 4.0 International Public License | CC-BY.

The data provided in the dataset are freely available, with the condition of attributing the Robert Koch Institute as the source, for anyone to process and modify, create derivatives of the dataset and use them for commercial and non-commercial purposes.
Further information about the license can be found in the LICENSE or LIZENZ file of the dataset.

Appendix

This is an example appendix 📂.

About

This repository contains the code for the manuscript Ensemble-labeling of infectious diseases time series to evaluate early warning systems with which you can reproduce the manuscript's results and figures.

Topics

Resources

License

Stars

Watchers

Forks

Packages

No packages published

Contributors 4

  •  
  •  
  •  
  •  

Languages