Bevorzugte / akzeptierte Datenformate für die Einreichung ins Repositorium

Art der Daten Bevorzugte Formate Andere akzeptierte Formate
Quantitative tabellarische Daten,
Datenbanken
Tabulator-, Komma- oder Spaltengetrennte Textdatei (*.csv), (*.tab), (*.txt) mit zusätzlicher Setup-Datei mit Datendefinitionen.
Selbstbeschreibende Formate wie JSON, Strukturierte Texte oder Mark-up Datei mit Metadaten wie *.xml.
DDI-XML Datei
OpenDocument- Tabellendokumente

  • MS Access (*.mdb , *.accdb)
  • MS Excel (*.xls, *.xlsx)
  • SPPS (*.por, *.sav)
  • STATA (*.dta)
  • SAS (*.sas, *.sas7bdat)
  • Syntax Dateien (*.sps)
  • dBase (*.dbf, *.ods)
  • Column Binary-Format
  • Geospatiale Daten Formate, die von guten Open Source Softwarebibliotheken wie GDAL, OGR und GeoTools unterstützt werden

  • ESRI Shapefile (*.shp, *.shx, *.dbf *.sbn)
  • Georeferenzierte TIFF (*.tif,*.tfw)
  • GIS Attributtabelle
  • MapInfo Interchange Format (*.mif) für vektorielle Daten
    Qualitative Text Daten
  • PDF/A (*.pdf)
  • eXtensible Mark-up Language XML mit Definitionen DTD oder Schema (*.xml)
  • Rich Text Format (*.rtf)
  • Text Datei [Unicode, UTF-8] (*.txt)
  • Hypertext Mark-up Language (HTML, HTMLbook)

  • MSWord (*.doc, *.docx)
  • OpenDocument Text (*.odt)
  • WordPerfect (*.wpd, *.cwp, *.vwp)
  • HTML (*.htm, *.html)
  • Bild Daten TIFF Version 6 unkomprimierte Dateien (*.tif)
    Portable Document Format PDF: nur Archive Format (PDF/A-1, A-2, A-3)!
  • JPEG (*.jpeg, *.jpg)
  • TIFF (andere Versionen *.tif,*.tiff)
  • JPEG 2000 (*.jp2)

  • Ältere PDF-Dateien – aber nicht älter als Version 5
    Digital Audio Daten
  • Free Lossless Audio Codec FLAC (*.flac)
  • MPEG-1 Audio Layer 3 (*.mp3 nur für gesprochenes Wort)
  • Audio Interchange File AIFF (*.aif)
  • Waveform Audio WAV (*.wav, *.ogg)
  • Digital Video Data
  • MPEG-4 High Profile (*.mp4)
  • Motion JPEG 2000 (*.jp2)
  • JPEG2000 (*.mj2)
  • Dokumentation und Skripte
  • Richt Text Format (.rtf)
  • Open Document Text (*.odt)
  • HTML (*.htm, *.html)
  • Plain text (*.txt)
  • Portable Document Format PDF: nur Archive Format PDF/A

  • MSWord (*.doc, *.docx)
  • MSExcel (*.xls, *.xlsx)
  • XML marked-up text mit entsprechenden DTD Schema
    Ältere PDF-Dateien – aber nicht älter als Version 5

    Die Wahl geeigneter Dateiformate ist ein sehr wichtiges Kriterium um die Interpretierbarkeit und Nutzbarkeit der Daten über die Zeit zu gewährleisten.
    Das Repositorium empfiehlt, wann immer es möglich ist, bevorzugte Formate zu benutzen. Andere Formate werden akzeptiert, aber die Lesbarkeit und Nutzbarkeit dieser Formate ist durch Veränderungen in den Hard- und Softwareumgebungen besonders bedroht. Das SADAR-Team kann die Wiederverwendbarkeit von Daten, die nicht in unseren bevorzugten Formaten geliefert wurden, nicht garantieren. Darüber hinaus, ist es möglich, spezifische Datenformate – nach Absprache mit den Datenerzeuger/innen – in bevorzugte Formate zu überführen. Diese Liste ist nicht umfassend und kann – nach Absprache mit den Datenerzeuger/innen – mit zusätzlichen Formaten erweitert werden.

    Unabhängig von den Datenformaten ist es wichtig sicherzustellen, dass Ihre Forschungsdatensätze dem Repositorium in organisierter Form und mit ausreichender Dokumentation übermittelt werden, um sicherzustellen, dass Dritte diese interpretieren und wiederverwenden können.

    Administration: SADAR Repositorium - Universitäts- und Landesbibliothek Sachsen Anhalt - Version 1.2 – Stand: Januar 2024