Published: 7. Juni, 2012 CONTENT NUTZUNG: CC BY-NC-SA 3.0

OpenRefine bietet mit der benutzerdefinierten Datenexport Funktion Templating eine simple Möglichkeit Daten in die gewünschte Endform zu überführen. Die Templating Funktion befindet sich rechts oben im Menü unter der Auswahl Export.

OpenRefine

Dort finden sich mit TSV, CSV, HTML, Excel etc. bereits vordefinierte Exporteinstellungen wieder. Nach der Auswahl der Templating Funktion öffnet sich eine Eingabemaske. Während man auf der linken Seite der Eingabemaske die Datenstruktur der Daten definiert, sieht man in der rechten Spalte eine Vorschau der Datenstruktur. Wenn man die Templating Funktion zum ersten Mal nutzt, bietet OpenRefine eine eigene Definition für den Datenexport an. Diese verwerfe ich, da ich an dieser Stelle nur das Grundkonzept erklären will, d.h. ich entferne den Inhalt aus den folgenden Masken Prefix, Row Template, Row Seperator, Suffix. Um auf die einzelnen Spalten, zuzugreifen wähle ich folgende Befehlszeile:

{{jsonize(cells["Geschlecht"].value)}}

dieser Befehl trägt für jede vordefinierte Spalte (hier Geschlecht) den Inhalt jeder Zeile ab. Somit kann ich flexibel nur jene Spalten exportieren, die relevant sind. Für das Beispiel habe ich die Spalten Geschlecht und Name gewählt:

{{jsonize(cells["Geschlecht"].value)}},{{jsonize(cells["Name"].value)}}

den Code um die einzelnen Spalten anzusprechen trennt ein Komma.

OpenRefine

Wenn die finale Datenstruktur bereits im Vorfeld bekannt (xml oder json) ist, sollte man die erforderlichen Strukturdefinitionen in der Prefix, Row Template, Row Seperator und Suffix Maske mitdefinieren.