Subject: OpenOffice Wörterbuch HowTo für die Umwandlung von .dic in .txt
OpenOffice Wörterbuch HowTo für die Umwandlung von .dic in .txt
1.) Was bezweckt dieses HowTo ?
Dieses HowTo befasst sich mit der Umwandlung von OpenOffice .dic Wörterbüchern in das unabhängige .txt Format.
Dabei schaffen wir es die Umlaute beizubehalten und wir werden mit proffesioneller Syntax im "Suchen und Ersetzen" Menü die Zeilenumbrüche löschen sodass jedes Wort untereinander steht und wir nich mühsam von Hand jeden Zeilenumbruch löschen müssen.
1.) Wie funktioniert's ?
1. Nehmt euch ein Wörterbuch von OpenOffice, dass das .dic Format hat. Dass .dic Format ist übrigens kein einheitliches Format und kann bei jeder Textverarbeitung eine andere Foramtierung aufweisen, deswegen "kann" dieses HowTo nur für OpenOffice funktionieren, aber es ist nicht ausgeschlossen, dass es auch bei anderen Textverarbeitungsprogrammen genauso funktioniert.
2. Man öffnet diese .dic Datei mit einem beliebigen Editor. Unter Linux z.B. Kate oder Kwrite. Unter Windows geht der normale Editor.
3. Man speichert die soeben geöffnete .dic Datei als .txt Datei, dann öffnet man sie wieder.
4. Nun kopiert man den kompletten Inhalt der .txt Datei in ein leeres Dokument in OpenOffice.
5. Nun sollte das Dokument etwa so aussehen:
Die Rauten müssen nicht unbedingt bei Ihnen vorkommen, aber keine Panik es ist halb so schlimm.
Momentan sieht die Datei ziemlich unsauber und unaufgeräumt aus und dass werden wir jetzt beheben.
6. Nun Markieren sie alles in ihrem Dokument (Strg+A). Dann drücken Sie Strg+F für das Suchen und Ersetzen Menü.
Dort geschieht folgendes!
Zuerst klicken sie unten auf "Zusätze" und vergewissern sich dass "Regulärer Ausdruck" und "Nur in Selektion" aktiviert ist (Häkchen).
Nun werden wir die Zeilenumbrüche "fixen". Das passiert folgendermaßen:
Bei dem Feld "Suchen Nach" klciken sie hinein und geben eine Leertaste ein, also im Feld "Suchen Nach" einmal die Leertaste drücken. Im Feld "Ersetzen Durch", geben sie folgenden Syntax ein : "&\n" ohne Anführungsstriche.
Dann klicken Sie auf "Ersetze Alle".
Nun sollte ihr Dokument ungefähr so aussehen :
Dort sind natürlich noch Leerzeichen zwischen den Wörtern und Rauten also ungewünschte Zeichen und dazu kommen wir jetzt.
7. Jetzt werden wir erstmal die Ungewünschten Zeichen entfernen. Dazu wieder alles markieren und das Suchen und Ersetzen Menü aufrufen mit Strg+F. Dort bei "Suchen Nach" die Raute eingeben und das "Erstzen Durch" Feld komplett leer lassen. Dann wieder auf "Ersetze Alle". Nun sind alle Rauten weg und jetzt kommen wir zu den Zeilenumbrüchen und Leerzeilen.
8. Ab jetzt wird es wichtig, dass genau gemacht wird was heir beschrieben wird sonst wird es nicht funktionieren.
Bisher sieht das Dokument so aus:
Abbuffen
Abfälligkeit
Abfärbens
Abhaltung
Ablüften
Abperleffekt
Absaugvorrichtung
Abschärfen
Abstumpfens
Abtrockenzeit
Abtränkbrühe
Abwasserschlammes
Abwelk
Abwelken
Mein Dokument hat ungefähr 40 Seiten sonst lohnt sich diese Automatiserung gar nicht, und die Beispiele sind nur ein kleiner Teil meines Dokuments.
Nun müssen wir einen kleinen Trick anwenden um die Leerzeichen zu entfernen. Dazu wieder alles markieren und das Suchen und Ersetzen Menü öffnen. Bei "Suchen Nach" wieder nur eine Leertaste eingeben und bei "Erstzen Durch" zum Beispiel ein @ Zeichen einfügen, auf jeden Fall keinen Buchstaben da dieser in den Wörtern vorkommen kann. Dann wieder auf "Ersetze Alle". Jetzt sieht das Dokument so aus :
Ich habe dabei dieses Zeichen verwendet "<". Wir sehen dass hinter den Wörtern auch noch Leerzeichen sind die jetzt durch dieses Zeichen erstezt worden sind.Das ist enorm wichtig für unseren nächsten Schritt die Zeilen zu löschen. Aber erstmal müssen wir das Zeichen das wir gerade eingefügt haben wieder Löschen, per Suchen und Erstzen. Also "Suchen Nach": >>>> und das "Ersetzten Durch" Feld leer lassen. Das war unser vorletzter Schritt.
9. Nun kommen wir zum letzten Schritt und das Dokument sieht so aus :
Nun werden wir die Zeilen alle zusammen mit einer Syntax aufrücken lassen.
Dazu markieren wir wieder alles und öffnen das Suchen Und Erstzen Menü per Strg+F. Dort vergewissern wir uns wieder ob die Optionen "Nur in Selektion" und "Regulärer Ausdruck" aktiviert sind.
Dann geben wir bei "Suchen Nach", "^$" ein, ohne Anführungszeichen.
Und bei "Ersetzen Durch" ein Sonderzeichen wie z.B "@". Dann sieht das Dokument so aus:
Jetzt müssen wir nur noch die "@" Zeichen durch nichts Ersetzen und schon haben wir folgendes Ergebnis:
Genau so sollte ein perfektes Wörterbuch aussehen. Diese Datei können sie dann als .txt Nur reinen Text speichern.
Jetzt haben sie ein universelles Wörterbuch im .txt Format
Viele Grüße und Gutes Gelingen
psycobeef
1.) Was bezweckt dieses HowTo ?
Dieses HowTo befasst sich mit der Umwandlung von OpenOffice .dic Wörterbüchern in das unabhängige .txt Format.
Dabei schaffen wir es die Umlaute beizubehalten und wir werden mit proffesioneller Syntax im "Suchen und Ersetzen" Menü die Zeilenumbrüche löschen sodass jedes Wort untereinander steht und wir nich mühsam von Hand jeden Zeilenumbruch löschen müssen.
1.) Wie funktioniert's ?
1. Nehmt euch ein Wörterbuch von OpenOffice, dass das .dic Format hat. Dass .dic Format ist übrigens kein einheitliches Format und kann bei jeder Textverarbeitung eine andere Foramtierung aufweisen, deswegen "kann" dieses HowTo nur für OpenOffice funktionieren, aber es ist nicht ausgeschlossen, dass es auch bei anderen Textverarbeitungsprogrammen genauso funktioniert.
2. Man öffnet diese .dic Datei mit einem beliebigen Editor. Unter Linux z.B. Kate oder Kwrite. Unter Windows geht der normale Editor.
3. Man speichert die soeben geöffnete .dic Datei als .txt Datei, dann öffnet man sie wieder.
4. Nun kopiert man den kompletten Inhalt der .txt Datei in ein leeres Dokument in OpenOffice.
5. Nun sollte das Dokument etwa so aussehen:
# WBSWG6� # Abbuffen
Abfälligkeit
Abfärbens Abhaltung Ablüften
Abperleffekt# Absaugvorrichtung# Abschärfen# Abstumpfens
Abtrockenzeit# Abtränkbrühe# Abwasserschlammes# Abwelk# Abwelken# Abölen# Abölung# Accounterstellung Acetogene# Achat# Acid Adrigkeit# Adsorptionsisothermen# Affinitätskurven# Agens# Agenzien# Agriculture# Airless# Albumine
Albzarella# Albüffelkäse Aldehyden# Aldehydgerbung
Alkalität# Altgrubengerbung
Altsalzburger# Altsämisch# Aminäscher
Analysendaten# Analysenmethoden# Andersfärbung# Aneinanderkleben
Anfallmengen# Anfeuchtung
Anfärbung Angerbung# Angreifbarkeit# Anilinleder# Anilinnappa# Animpfen# Anreißbereiche
.
.
.
Abfälligkeit
Abfärbens Abhaltung Ablüften
Abperleffekt# Absaugvorrichtung# Abschärfen# Abstumpfens
Abtrockenzeit# Abtränkbrühe# Abwasserschlammes# Abwelk# Abwelken# Abölen# Abölung# Accounterstellung Acetogene# Achat# Acid Adrigkeit# Adsorptionsisothermen# Affinitätskurven# Agens# Agenzien# Agriculture# Airless# Albumine
Albzarella# Albüffelkäse Aldehyden# Aldehydgerbung
Alkalität# Altgrubengerbung
Altsalzburger# Altsämisch# Aminäscher
Analysendaten# Analysenmethoden# Andersfärbung# Aneinanderkleben
Anfallmengen# Anfeuchtung
Anfärbung Angerbung# Angreifbarkeit# Anilinleder# Anilinnappa# Animpfen# Anreißbereiche
.
.
.
Die Rauten müssen nicht unbedingt bei Ihnen vorkommen, aber keine Panik es ist halb so schlimm.
Momentan sieht die Datei ziemlich unsauber und unaufgeräumt aus und dass werden wir jetzt beheben.
6. Nun Markieren sie alles in ihrem Dokument (Strg+A). Dann drücken Sie Strg+F für das Suchen und Ersetzen Menü.
Dort geschieht folgendes!
Zuerst klicken sie unten auf "Zusätze" und vergewissern sich dass "Regulärer Ausdruck" und "Nur in Selektion" aktiviert ist (Häkchen).
Nun werden wir die Zeilenumbrüche "fixen". Das passiert folgendermaßen:
Bei dem Feld "Suchen Nach" klciken sie hinein und geben eine Leertaste ein, also im Feld "Suchen Nach" einmal die Leertaste drücken. Im Feld "Ersetzen Durch", geben sie folgenden Syntax ein : "&\n" ohne Anführungsstriche.
Dann klicken Sie auf "Ersetze Alle".
Nun sollte ihr Dokument ungefähr so aussehen :
#
WBSWG6�
#
Abbuffen
Abfälligkeit
Abfärbens
Abhaltung
Ablüften
Abperleffekt#
Absaugvorrichtung#
Abschärfen#
Abstumpfens
Abtrockenzeit#
Abtränkbrühe#
Abwasserschlammes#
Abwelk#
WBSWG6�
#
Abbuffen
Abfälligkeit
Abfärbens
Abhaltung
Ablüften
Abperleffekt#
Absaugvorrichtung#
Abschärfen#
Abstumpfens
Abtrockenzeit#
Abtränkbrühe#
Abwasserschlammes#
Abwelk#
Dort sind natürlich noch Leerzeichen zwischen den Wörtern und Rauten also ungewünschte Zeichen und dazu kommen wir jetzt.
7. Jetzt werden wir erstmal die Ungewünschten Zeichen entfernen. Dazu wieder alles markieren und das Suchen und Ersetzen Menü aufrufen mit Strg+F. Dort bei "Suchen Nach" die Raute eingeben und das "Erstzen Durch" Feld komplett leer lassen. Dann wieder auf "Ersetze Alle". Nun sind alle Rauten weg und jetzt kommen wir zu den Zeilenumbrüchen und Leerzeilen.
8. Ab jetzt wird es wichtig, dass genau gemacht wird was heir beschrieben wird sonst wird es nicht funktionieren.
Bisher sieht das Dokument so aus:
Abbuffen
Abfälligkeit
Abfärbens
Abhaltung
Ablüften
Abperleffekt
Absaugvorrichtung
Abschärfen
Abstumpfens
Abtrockenzeit
Abtränkbrühe
Abwasserschlammes
Abwelk
Abwelken
Mein Dokument hat ungefähr 40 Seiten sonst lohnt sich diese Automatiserung gar nicht, und die Beispiele sind nur ein kleiner Teil meines Dokuments.
Nun müssen wir einen kleinen Trick anwenden um die Leerzeichen zu entfernen. Dazu wieder alles markieren und das Suchen und Ersetzen Menü öffnen. Bei "Suchen Nach" wieder nur eine Leertaste eingeben und bei "Erstzen Durch" zum Beispiel ein @ Zeichen einfügen, auf jeden Fall keinen Buchstaben da dieser in den Wörtern vorkommen kann. Dann wieder auf "Ersetze Alle". Jetzt sieht das Dokument so aus :
#>>>>
WBSWG6�>>>>
>>>>
#>>>>
Abbuffen
>>>>
Abfälligkeit
>>>>
Abfärbens >>>>
Abhaltung >>>>
Ablüften
>>>>
Abperleffekt#>>>>
Absaugvorrichtung#>>>>
Abschärfen#>>>>
Abstumpfens
>>>>
Abtrockenzeit#>>>>
Abtränkbrühe#>>>>
Abwasserschlammes#>>>>
WBSWG6�>>>>
>>>>
#>>>>
Abbuffen
>>>>
Abfälligkeit
>>>>
Abfärbens >>>>
Abhaltung >>>>
Ablüften
>>>>
Abperleffekt#>>>>
Absaugvorrichtung#>>>>
Abschärfen#>>>>
Abstumpfens
>>>>
Abtrockenzeit#>>>>
Abtränkbrühe#>>>>
Abwasserschlammes#>>>>
Ich habe dabei dieses Zeichen verwendet "<". Wir sehen dass hinter den Wörtern auch noch Leerzeichen sind die jetzt durch dieses Zeichen erstezt worden sind.Das ist enorm wichtig für unseren nächsten Schritt die Zeilen zu löschen. Aber erstmal müssen wir das Zeichen das wir gerade eingefügt haben wieder Löschen, per Suchen und Erstzen. Also "Suchen Nach": >>>> und das "Ersetzten Durch" Feld leer lassen. Das war unser vorletzter Schritt.
9. Nun kommen wir zum letzten Schritt und das Dokument sieht so aus :
Abbuffen
Abfälligkeit
Abfärbens
Abhaltung
Ablüften
Abperleffekt
Absaugvorrichtung
Abschärfen
Abstumpfens
Abtrockenzeit
Abtränkbrühe
Abwasserschlammes
Abwelk
Abwelken
Abölen
Abölung
Accounterstellung
Acetogene
Achat
Acid
Adrigkeit
Adsorptionsisothermen
Affinitätskurven
Agens
Agenzien
Agriculture
Airless
Albumine
Albzarella
Albüffelkäse
Aldehyden
Aldehydgerbung
Alkalität
Altgrubengerbung
Abfälligkeit
Abfärbens
Abhaltung
Ablüften
Abperleffekt
Absaugvorrichtung
Abschärfen
Abstumpfens
Abtrockenzeit
Abtränkbrühe
Abwasserschlammes
Abwelk
Abwelken
Abölen
Abölung
Accounterstellung
Acetogene
Achat
Acid
Adrigkeit
Adsorptionsisothermen
Affinitätskurven
Agens
Agenzien
Agriculture
Airless
Albumine
Albzarella
Albüffelkäse
Aldehyden
Aldehydgerbung
Alkalität
Altgrubengerbung
Nun werden wir die Zeilen alle zusammen mit einer Syntax aufrücken lassen.
Dazu markieren wir wieder alles und öffnen das Suchen Und Erstzen Menü per Strg+F. Dort vergewissern wir uns wieder ob die Optionen "Nur in Selektion" und "Regulärer Ausdruck" aktiviert sind.
Dann geben wir bei "Suchen Nach", "^$" ein, ohne Anführungszeichen.
Und bei "Ersetzen Durch" ein Sonderzeichen wie z.B "@". Dann sieht das Dokument so aus:
Abbuffen
@@Abfälligkeit
@@Abfärbens
Abhaltung
Ablüften
@@Abperleffekt
Absaugvorrichtung
Abschärfen
Abstumpfens
@@Abtrockenzeit
Abtränkbrühe
Abwasserschlammes
Abwelk
Abwelken
Abölen
Abölung
Accounterstellung
Acetogene
Achat
Acid
Adrigkeit
Adsorptionsisothermen
Affinitätskurven
Agens
Agenzien
Agriculture
Airless
Albumine
@@Albzarella
Albüffelkäse
Aldehyden
Aldehydgerbung
@@Alkalität
Altgrubengerbung
@@Altsalzburger
Altsämisch
Aminäscher
@@Analysendaten
@@Abfälligkeit
@@Abfärbens
Abhaltung
Ablüften
@@Abperleffekt
Absaugvorrichtung
Abschärfen
Abstumpfens
@@Abtrockenzeit
Abtränkbrühe
Abwasserschlammes
Abwelk
Abwelken
Abölen
Abölung
Accounterstellung
Acetogene
Achat
Acid
Adrigkeit
Adsorptionsisothermen
Affinitätskurven
Agens
Agenzien
Agriculture
Airless
Albumine
@@Albzarella
Albüffelkäse
Aldehyden
Aldehydgerbung
@@Alkalität
Altgrubengerbung
@@Altsalzburger
Altsämisch
Aminäscher
@@Analysendaten
Jetzt müssen wir nur noch die "@" Zeichen durch nichts Ersetzen und schon haben wir folgendes Ergebnis:
Abbuffen
Abfälligkeit
Abfärbens
Abhaltung
Ablüften
Abperleffekt
Absaugvorrichtung
Abschärfen
Abstumpfens
Abtrockenzeit
Abtränkbrühe
Abwasserschlammes
Abwelk
Abwelken
Abölen
Abölung
Accounterstellung
Acetogene
Achat
Acid
Adrigkeit
Adsorptionsisothermen
Affinitätskurven
Agens
Agenzien
Agriculture
Airless
Albumine
Albzarella
Albüffelkäse
Aldehyden
Aldehydgerbung
Alkalität
Altgrubengerbung
Altsalzburger
Altsämisch
Aminäscher
Analysendaten
Analysenmethoden
Abfälligkeit
Abfärbens
Abhaltung
Ablüften
Abperleffekt
Absaugvorrichtung
Abschärfen
Abstumpfens
Abtrockenzeit
Abtränkbrühe
Abwasserschlammes
Abwelk
Abwelken
Abölen
Abölung
Accounterstellung
Acetogene
Achat
Acid
Adrigkeit
Adsorptionsisothermen
Affinitätskurven
Agens
Agenzien
Agriculture
Airless
Albumine
Albzarella
Albüffelkäse
Aldehyden
Aldehydgerbung
Alkalität
Altgrubengerbung
Altsalzburger
Altsämisch
Aminäscher
Analysendaten
Analysenmethoden
Genau so sollte ein perfektes Wörterbuch aussehen. Diese Datei können sie dann als .txt Nur reinen Text speichern.
Jetzt haben sie ein universelles Wörterbuch im .txt Format
Viele Grüße und Gutes Gelingen
psycobeef
psycobeef
Show profile
Link to this post