Skip to content
Snippets Groups Projects
Commit 8cc028ad authored by Vanessa Stehr's avatar Vanessa Stehr
Browse files

Tabellendokument: Notwendigkeit hervorheben

Closes #28
parent 125e9563
No related branches found
No related tags found
No related merge requests found
Pipeline #52673 failed
...@@ -13,6 +13,26 @@ Die Repräsentation als XML-Listen verringert die Dateigröße sowie die benöti ...@@ -13,6 +13,26 @@ Die Repräsentation als XML-Listen verringert die Dateigröße sowie die benöti
Ein Datenverlust sowie eine Fehlinterpretation der Daten (z.B. durch "Verrutschen" von Tabellenspalten) ist in keiner Umsetzungsvariante zu erwarten. Ein Datenverlust sowie eine Fehlinterpretation der Daten (z.B. durch "Verrutschen" von Tabellenspalten) ist in keiner Umsetzungsvariante zu erwarten.
Bei der Repräsentation einer großen Tabelle mittels einzelner XML-Elemente für jeden Wert wird der Ressourcenbedarf leicht so groß, dass die Tabelle nicht mehr effizient maschinell verarbeitet werden kann. Bei der Repräsentation einer großen Tabelle mittels einzelner XML-Elemente für jeden Wert wird der Ressourcenbedarf leicht so groß, dass die Tabelle nicht mehr effizient maschinell verarbeitet werden kann.
## Notwendigkeit eines einheitlichen Tabellenformats
Die tabellierten Daten werden im DCC in erster Linie maschineninterpretierbar abgelegt.
Dies ist notwendig, damit die Daten gut verarbeitet werden können.
Damit die Daten dennoch von Menschen gelesen, überprüft und interpretiert werden können, können sie dann mithilfe geeigneter Software entsprechend dargestellt werden.
Ein kurzes Gedankenexperiment: Angenommen, die Daten würden direkt im DCC möglichst menschenlesbar abgelegt werden, je nach Community und Anwendungsfall in einem anderen Format.
Eine einheitliche Software zum Arbeiten mit diesen Daten wäre dann immer unvollständig, da es unzählige Möglichkeiten gibt, tabellierte Daten schemakonform im DCC abzulegen.
Hier müssten also Menschen die Daten für die maschinelle Verarbeitung von Hand vorbereiten - eine Aufgabe, die andernfalls entfällt bzw. bei der Erstellung des Scheins von Computerprogrammen übernommen wird.
Zudem würden Daten zur besseren Lesbarkeit wiederholt werden, so, wie ea auch jetzt schon bei analogen Scheinen gängige Praxis ist.
Schon jetzt gibt es dadurch Scheine, die nicht mehr ohne weiteres auf jedem System einfach eingelesen werden können.
Legt man die Daten dagegen in einem einheitlichen, kompakten, und maschineninterpretierbaren Format ab, so kann Software die Verarbeitung dieser Daten automatisiert übernehmen.
Es wird problemlos möglich, die tabellierten Daten in verschiedene Formaten übersichtlich darzustellen, etwa als interaktiver Plot oder Tabelle mit Filteroptionen. Ebenso können mit den Daten verschiedenste Berechnungen durchgeführt werden.
Ein einheitliches Format zum Ablegen von tabellierten Daten verringert also den Arbeitsaufwand für die Verarbeitung, ermöglicht eine nutzerfreundliche Darstellung, und macht damit die Daten besser interpretier- und verwendbar.
Ohne ein einheitliches Format wird es auch weiterhin nicht möglich sein, mit tabellierten Daten effizient zu arbeiten.
Für den größtmöglichen Nutzen des DCC ist ein allgemeiner Standard für tabellierte Daten unverzichtbar.
Je schneller ein solcher Standard geschaffen wird, desto einfacher wird die Etablierung dieses, da sich mit der Zeit sonst in verschiedenen Communities sicherlich de-facto Standards etablieren werden, die allerdings nicht universell anwendbar seien werden.
## Abstraktion: Was sind Tabellen und tabellierte Daten? ## Abstraktion: Was sind Tabellen und tabellierte Daten?
### Listen von Listen ### Listen von Listen
......
0% Loading or .
You are about to add 0 people to the discussion. Proceed with caution.
Please register or to comment