Importdateien als Datenquelle

Mit Kommandozeilenparametern kann man die meisten Optionen des Dialogs Textimport spezifizieren.

Ausnahme: Die Spaltenerkennung Feste Spaltenbreite kann nicht mit Kommandozeilen eingestellt werden. Falls Sie eine Datenquelle mit fester Spaltenbreite haben, benutzen Sie am besten eine InfoZoom-Vorlage mit einer entsprechend eingestellten Datenquelle und laden die Daten mittels -load in die Vorlage.

Die Anzeige des Dialogs Textimport wird bei der Stapelverarbeitung unterdrückt, wenn die Orientierung (-rows bzw. -columns) oder das Trennzeichen (mit -delimiter) vorgegeben wird. Wenn der Dialog erscheint (also wenn weder Orientierung noch Trennzeichen spezifiziert wurden), sind die bisherigen Angaben zum Import (z.B. zur Codierung) voreingestellt.

Die Spezifikationen für einen Textimport müssen vor dem Namen einer Importdatei stehen, also einer Datei mit Endung *.txt oder *.csv. Sie gelten für eventuell folgende Importe, aber auch für Exporte (soweit zutreffend) bis zum Ende der Kommandozeile.

Beispiel

InfoZoom -rows -delimiter \t -attributeline 1 -dataline 5 -UTF8 Cabrios.txt

FOC-Dateiformat als Import

Das *.foc-Dateiformat spielt beim Import eine ganz besondere Rolle. Eigentlich ist das Format durch InfoZoom genau festgelegt - andererseits kann das Einlesen per Stapelverarbeitung dennoch mit den unten beschriebenen Parametern beeinflusst werden. Die Standardregeln für *.foc sind:

  • Ist das erste Zeichen ein BOM-Character, ist die Codierung UTF8, ansonsten ANSI.

  • Beginnt die Tabelle mit einem Schrägstrich (/), ist die Anordnung der Objekte zeilenweise, sonst spaltenweise.

  • Als Feldtrennzeichen wird der Tabulator benutzt.

  • Als Texterkennungszeichen dienen Doppelhochkommata.

Beim Einlesen einer Datei mit Endung *.foc per Kommandozeile werden untenstehende Parameter aber nur berücksichtigt, wenn die Orientierung (-rows bzw. -columns) oder das Trennzeichen (mit -delimiter) angegeben wurde. Der Dialog Textimport erscheint nie beim FOC-Format.

Hinweis: Beginnt die Datei mit dem BOM-Character, findet dieser Berücksichtigung; -ANSI oder -charset wird dann ignoriert. Beginnt die Tabelle mit einem Schrägstrich wird eine zeilenweise Anordnung der Datensätze angenommen, selbst wenn -columns angegeben wurde.

Parameter für das Einlesen von Importdateien

-ANSI

Die Importdatei liegt in der Textcodierung ANSI vor (default). Siehe auch -charset.

-UTF8

Die Importdatei liegt in der Textcodierung ANSI vor.

-UTF16BigEndian

Die Importdatei liegt in der Textcodierung UTF-16 Big Endian vor.

-UTF16LittleEndian

Die Importdatei liegt in der Textcodierung UTF-16 Little Endian (auch als Unicode bezeichnet) vor.

-charset Zeichensatz

Die Importdatei liegt in der Textcodierung ANSI vor und der Zeichensatz lautet: WESTERN, CENTRALEUROPEAN, GREEK, RUSSIAN, BALTIC, TURKISH, HEBREW, ARABIC, VIETNAMESE oder THAI. Wird ein ungültiger Zeichensatz angegeben, so kommt eine Fehlermeldung, die alle zulässigen Zeichensätze auflistet. -charset macht nur in Verbindung mit der Codierung ANSI Sinn. Daher kann die Angabe von -ANSI entfallen. Der Default richtet sich nach den Ländereinstellungen von MS-Windows.

-rows

Die Anordnung der Datensätze ist zeilenweise. Der Importdialog wird bei Angabe von -rows unterdrückt.

-rows ist der Default.

-columns

Die Anordnung der Datensätze ist spaltenweise. Der Importdialog wird bei Angabe von -columns unterdrückt.

-attributeLine Zahl

Mit Zahl wird die Zeilennummer der Attribute angegeben (bei der Anordnung -rows). Dabei bedeutet 0 (Null): Keine Attributnamen (auch für die Anordnung -columns). Default ist 1 (Zeile Eins bzw. Attributnamen sind angegeben). Wenn -attributeLine angegeben wird, dann ist der Default die Zeile vor -dataLine.

-dataLine Zahl

Mit Zahl wird die Zeilennummer der ersten Datenzeile angegeben (bei der Anordnung -rows). Default ist Zeile 2. Wenn -attributeline angegeben wird, dann ist der Default die Zeile hinter -attributeLine.

-maxRecords Anzahl

Die Anzahl der zu importierenden Datensätze ist auf Anzahl begrenzt. Default: Alle Datensätze werden eingelesen.

Der Importdialog wird bei Angabe von -maxRecords unterdrückt. -maxRecords wird nur bei der Anordnung -rows beachtet.

-delimiter Zeichen oder -d Zeichen

Spezifiziert mit Zeichen das Trennzeichen der Datenfelder. Es sind beliebige einzelne Zeichen erlaubt. Wenn das Trennzeichen ein Tabulator ist, dann schreibe man \t oder tab. Für ein Leerzeichen kann man neben " " auch blank angeben. Der Importdialog wird bei Angabe von -delimiter unterdrückt. Default ist Tabulator (\t).

-doubleQuotes

Spezifiziert das Texterkennungszeichen als Doppelhochkomma ("). Default.

-singleQuotes

Spezifiziert das Texterkennungszeichen als Einzelhochkomma (').

-noQuotes

Spezifiziert, dass kein Texterkennungszeichen erkannt wird.

Siehe auch: