Eigenes Wörtebuch erstellen (kein kleines Benuzerwörterbuch)

Das Textverarbeitungsprogramm

Moderator: Moderatoren

Loretta Garden
Beiträge: 7
Registriert: Do, 21.10.2004 10:35

Eigenes Wörtebuch erstellen (kein kleines Benuzerwörterbuch)

Beitrag von Loretta Garden »

Hallo erstmal 8) an alle.

Ich suche eine Möglichkeit ein eigenes Wörterbuch unter OpenOffice 1.1.3 zu erstellen. Damit meine ich aber nicht die User-spezifichen denn diese sind mit ihrer Kapazität schnell voll und derer 6-8 oder mehr anzulegen ist ja auch nicht das wahre :?

Leider kann ich diesbezüglich keine Information finden (1 posting aus dem ich aber nicht so recht schlau werde) aber es soll wohl möglich sein.

Wenn jemand da bescheid wüßte und helfen kann ... ich bin sehr dankbar 8)
denn langsam verzweifle ich hier.

Mit bestem Dank ... *winke winke*
Chris
**
Beiträge: 29
Registriert: So, 29.06.2003 09:24

Beitrag von Chris »

Hi,

Dafür muß eine Wortliste im .txt Format erstellt und sortiert werden.
Grundsätzlich für jedes Wort eine eigene Zeile.
Wortanzahl (Zeilen) zählen und die Anzahl als erste Zeile ergänzen.

Beispiel:
4
Ich
bin
ein
Wörterbuch

Evtl. noch so optimieren: http://lingucomponent.openoffice.org/affix.readme

Das ganze utf8 kodiert unter */share/dict/ooo/privat.dic speichern und in der dictionary.lst zum Beispiel für Deutschland folgendes eintragen:

DICT de DE privat

Gruß
Chris
Chris
**
Beiträge: 29
Registriert: So, 29.06.2003 09:24

Beitrag von Chris »

Du mußt nur das "*WBSWG6*" vor dem ersten Eintrag entfernen und die Steuerzeichen zwischen den anderen Einträgen durch einen Zeilenumbruch ersetzen.
Das ganze wie beschrieben verarbeiten und Du hast ein eigenes Wörterbuch, das im Gegensatz zu Benutzerwörterbüchern auch für Korrektur Vorschläge verwendet wird ;-)

Gruß
Chris
Loretta Garden
Beiträge: 7
Registriert: Do, 21.10.2004 10:35

Beitrag von Loretta Garden »

Jo, sorry das ich jetzt erst Antworte :oops:

Na ja, nach Stunden des probierens will er die so erstellten Wörterbücher nicht benutzen ( da kommt erstmal mein Dank für deine Antworten! )

Habe es so gemacht wie du es beschrieben hast aber er scheint sie nicht zu erkennen, er markiert halt die Wörter wie ohne eigenes WB. Oder darf ich jeweils nur ein Hauptwörterbuch aktiviert haben? Also entweder Deutsch oder mein erstelltes? Werde ich gleich nocheinmal versuchen.

Vieleicht weißt du wo da der Fehler liegen könnte ?
Schönes WE & besten Dank für deine Mühe :D
Chris
**
Beiträge: 29
Registriert: So, 29.06.2003 09:24

Beitrag von Chris »

Hi,

Du kannst ohne weiteres mehrere Wörterbücher parallel betreiben.
Wenn das zu viele (ab 10) umfangreiche Wörterbücher sind wird das allerdings irgendwann etwas träge.

Zur Fehlersuche:
Wie sieht der Eintrag in deiner dictionary.lst und der Inhalt von [OOo]/share/dict/ooo aus?

Dir ist klar, dass du OOo und den Schnellstarter beenden und danach OOo neu Starten musst um die Änderungen zu aktivieren?

Gruß
Chris
Loretta Garden
Beiträge: 7
Registriert: Do, 21.10.2004 10:35

Beitrag von Loretta Garden »

Da bin ich wieder!

Also her mal meine dictionary.lst

DICT en US en_US
HYPH en US hyph_en_US
THES en US th_en_US
DICT de DE de_DE
DICT de DE de_DE_neu
DICT de DE de_DE_comb
DICT de DE privat
HYPH de DE hyph_de_DE
THES de DE th_de_DE


hier dann der inhalt von %programme%Openoffice.org\share\dict\ooo
23.10.2004 18:59 <DIR> .
23.10.2004 18:59 <DIR> ..
02.04.2004 06:25 29.742 de_DE.aff
02.04.2004 06:25 3.714.751 de_DE.dic
21.10.2004 12:02 32.471 de_DE_comb.aff
21.10.2004 12:02 4.372.153 de_DE_comb.dic
21.10.2004 12:02 32.471 de_DE_neu.aff
21.10.2004 12:02 4.334.241 de_DE_neu.dic
04.05.2004 01:10 93.503 DicOOo.sxw
23.10.2004 18:52 754 dictionary.lst
20.10.2004 18:28 717 dictionary.lst.1st
21.10.2004 12:00 841 dictionary.lst.old
04.05.2004 01:10 27.375 en_GB.aff
04.05.2004 01:10 526.269 en_GB.dic
04.05.2004 01:10 2.731 en_US.aff
04.05.2004 01:10 695.728 en_US.dic
04.05.2004 01:10 83.704 FontOOo.sxw
04.05.2004 01:10 6.049 hyph_da_DK.dic
04.05.2004 01:10 42.600 hyph_de_DE.dic
04.05.2004 01:10 79.272 hyph_en_GB.dic
04.05.2004 01:10 36.467 hyph_en_US.dic
04.05.2004 01:10 2.616 hyph_it_IT.dic
04.05.2004 01:10 22.071 hyph_ru_RU.dic
04.05.2004 01:10 34.142 it_IT.aff
04.05.2004 01:10 1.191.233 it_IT.dic
23.10.2004 18:59 0 list.txt
23.10.2004 18:51 33.859 privat.dic
04.05.2004 01:10 1.438 README_en_GB.txt
04.05.2004 01:10 14.164 README_it_IT.txt
21.10.2004 12:02 320.798 th_de_DE.dat
21.10.2004 12:02 638.584 th_de_DE.idx
04.05.2004 01:10 3.344.748 th_en_US.dat
04.05.2004 01:10 517.512 th_en_US.idx
31 Datei(en) 20.233.004 Bytes

ach ja, mein System ist windows xp pro / sp2 ... (wie man sieht) das hatten wir ja noch nicht.
Und neu gestartet habe ich natürlich auch :)
Chris
**
Beiträge: 29
Registriert: So, 29.06.2003 09:24

Beitrag von Chris »

Hi,

auf Anhieb sehe ich da keinen Fehler.
Irgendwas scheint bei dir aber schief gegangen zu sein.

Möglicherweise hilft dir das Posting vom Autor der Rechtschreibprüfung zu diesem Thema.
http://www.openoffice.org/issues/show_bug.cgi?id=17805

Etwas OT:
Du hast de_DE, de_DE_neu und de_DE_comb aktiviert was IMHO keinen Sinn macht. Ich würde mich in diesem Fall zwischen de_DE_neu und de_DE_comb entscheiden.

Chris
Loretta Garden
Beiträge: 7
Registriert: Do, 21.10.2004 10:35

Beitrag von Loretta Garden »

Also ...
die anderen deutschen WBs hab ich nur testweise installiert gehabt 8)
Habe jetzt meine WBs nochmals überarbeitet und Alphabetisch sortiert, dann mit den Windows Editor im UTF-8 Format abgespeichert und das wars.
Es will einfach nicht funzen. Habe es auf Win98 / 2000 und mehren Xp-Pro installationen versucht mit immer dem selben Ergebnis.
Ach ja, OO-Versionen waren 1.1.2 & 1.1.3.
Also hab ich es mal nur mit 3 -4 Wörtern probiert aber auch hier möchte er diese nicht benutzen - ich verzweifel hier langsam :(

Wenn es doch bei einigen hier funktioniert, warum dann nicht bei mir ?
Muß ich beim Abspeichern der Wortlisten irgendetwas beachten was ich jetzt übersehen habe? Also die Zeilenangabe habe ich natürlich auch gemacht, darauf geachtet das kein Wort doch noch im Hauptwörterbuch vorhanden ist. Ja, aber wenn das alles gewesen sein sollte - warum benutzt er diese nicht?
Formatfehler? UTF-8 mit dem Windows Editor sollte doch in Ordnung sein,oder? Oder gibt es alternativen? Ich kenne im Mom keine.

Abervielen Dank für deine Hilfe Chris!
Chris
**
Beiträge: 29
Registriert: So, 29.06.2003 09:24

Beitrag von Chris »

Hi,

wenn das bei dir nicht funktioniert ist irgend was schief gelaufen...
Habe jetzt meine WBs nochmals überarbeitet und Alphabetisch sortiert, dann mit den Windows Editor im UTF-8 Format abgespeichert und das wars.
Hast Du die Worte nicht gezählt und als erste Zeile eingefügt?
Wenn es doch bei einigen hier funktioniert, warum dann nicht bei mir ?
Ich habe keine Ahnung.
Mit Windows Editoren kenne ich mich nicht aus.
Falls dein Wörterbuch nicht geheim ist, schick mir mal eine pn um zu erfahren wohin du das schicken kannst. Ich könnte dann mal einen Blick darauf werfen.

Chris
Loretta Garden
Beiträge: 7
Registriert: Do, 21.10.2004 10:35

Beitrag von Loretta Garden »

:D Hallo Chris!
Ich habe es wohl geschafft! Und jetzt wo ich dein letztes posting gelesen habe!!! Erleuchtung :wink:

Also: Hatte ja alles ganz normal mit einem Editor unter Windows erstellt. Dann sortiert , Zeilenanzahl als erste Zeile eingetragen und im UTF-8 Format gesichert ... und das wollte ja nicht (ich habe hier echt Stunden / Tage damit verbracht )

Dann hatte ich irgendwann die Idee das File von DOS->Unix zu konvertieren und dann! erst nach UTF-8 und sichern .... voi la , alles läuft jetzt prima!
Mit Vorschlägen und Erkennung .... und ich bin saufroh es dochnoch hinbekommen zu haben. Hatte es echt schon aufgegeben und mich nach Alternativen umgesehen, wobei mich keine so recht überzeugen konnte. Hab mich schon einfach zu sehr an OO gewöhnt :lol:

Oh man, manchmal denke ich auch ... schei... MS! Daß das Problem beim guten Billy lag ... (naja, zum großen Teil :lol: ) konnte ich ja nun wirklich nicht ahnen.

Oh man, bin ich froh *jubel* und jetzt ..... an dich einen RIESEN DANK!!!

Vieleicht hilft das ja noch ein paar Leuten die auf die selben Probleme stoßen!

So, ich geh jetzt erstmal einen Kaffee trinken *binnochganzeuphorisch*

P.S.: Kein Wunder das die Leute unter den *IXEN damit keinen Ärger haben *lol*

Ok, nochmals *winkewinke* Danke an dich Chris für deine Geduld mit mir!

bye bye - eine glückliche OO Userin mehr ! 8)

PPS.: Da fällt mir noch ein : Ich mußte ja noch mit einem Hexeditor den Header der fertigen Datei bereinigen !!! Also alle Steuercodes VOR der Zahl mit den Werten der Zeilenanzahl! Sonst will er mein neu erstelltes WB auch nicht benutzen!

Ok, jetzt aber - - - > Kaffee holen :wink:
Opus
Beiträge: 7
Registriert: Mo, 11.10.2004 03:17

Beitrag von Opus »

Kannst Du auch ein neues Wort, dass Du im Text bei der Rechtschreibprüfung markierst, in Dein neues großes Lexikon aufnehmen, ohne den ganzen Export und Import-Umweg zu gehen?
Opus
Loretta Garden
Beiträge: 7
Registriert: Do, 21.10.2004 10:35

Beitrag von Loretta Garden »

Opus hat geschrieben:Kannst Du auch ein neues Wort, dass Du im Text bei der Rechtschreibprüfung markierst, in Dein neues großes Lexikon aufnehmen, ohne den ganzen Export und Import-Umweg zu gehen?
Opus
Nein! Leider muß das neue Wort wohl über den Umweg reingebracht werden.
Aber ich warte damit immer, sammle also in einem normalen User-WB all die Wörter die später in mein Großes Stammwörterbuch fließen sollen.

Aber ich habe jetzt herrausgefunden das das erstellen von eigenen WBs einfacher mit UltraEdit (unter Windows) funzt!
Einfach die Wörter die rein sollen sammeln -- > sortieren --> Zeilenanzahl eintragen --> auf "konvertieren" gehen und dort "DOS nach Unix" selektieren und dann einfach sichern und benutzen! Also einfach und schnell ohne vorherige nochmalige umwandlung nach UTF-8 etc.
Allerdings frage ich mich wieso? Hauptsache es funktioniert.

Das einzige was etwas "nervig" ist, die user-WBs auseinander zu pfücken :lol: und alle Steuercodes "von Hand/ globaler Suche" herausfischen ...
Aber man bekommt schnell "Übung" :shock: :lol:
mch225
**
Beiträge: 22
Registriert: Fr, 14.01.2005 10:42
Kontaktdaten:

Beitrag von mch225 »

Hallo zusammen,

da ich gerade ein ähnliches Problem habe - nämlich die erschreckend schlechte Qualität der dt. OpenOffice-Wörterbücher -, möchte ich selbige verbessern. Dazu war dieser Thread äußerst hilfreich, vielen Dank! :)
Jetzt habe ich aber noch eine Frage zum selben Thema. Öffnet man das OOo-Wörterbuch (bei mir unter /opt/OpenOffice.org/share/dict/ooo/de_DE.dic) mit einem Texteditor, so sieht der Anfang folgendermaßen aus:

76257
Äbte/N
Äbtissin/F
Ächtung/P
Äcker/N
Äderchen/S

Soweit ich sehe, hat das Wörterbuch also 76257 Einträge. Was ich jetzt gern wissen würde, ist, was die Schrägstriche und die Buchstaben danach bedeuten. Ich vermute mal, die stehen in Verbindung mit de_DE.aff, eine Datei, die die Affix-Möglichkeiten des Dt. enthält. Wenn ich jetzt ein neues Wort hinzufüge, so z. B. "Bemalung" (was nicht enthalten ist!), möchte ich natürlich, daß Writer auch "Bemalungen" als richtig erkennt. Wahrscheinlich muß ich das Wort daher irgendwie mit diesen Kommentaren hinter den Schrägstrichen versehen. Weiß jemand Genaueres?

Bin für jede Hilfe dankbar! :)

edit: Hier steht was Interessantes:
http://www.entwickler.com/sus/sus_buch/ ... 1de2aa.pdf
(Man beachte besonders den Punkt 5.6 "Blick in die Wörterbücher"!)
Chris
**
Beiträge: 29
Registriert: So, 29.06.2003 09:24

Beitrag von Chris »

Moin,

wie sich die Affix Geschichte Entschlüsseln läßt steht hier.
http://lingucomponent.openoffice.org/affix.readme

Für die deutsche Silbentrennung solltest du mal einen Blick in [OOo]/share/dict/ooo/hyph_de_DE.dic werfen.
Weitere Infos zur Silbentrennung findest du auch im Lingucomponent Projekt.
http://lingucomponent.openoffice.org/hyphenator.html

Gruß
Chris
Joke
*****
Beiträge: 378
Registriert: Sa, 19.02.2005 20:23

Beitrag von Joke »

Hallo Chris,

danke für die Antwort. Habe ich leider gerade eben erst bemerkt, weil ich beim Schreiben zwar soeben registriert war, aber noch als Gast gelaufen bin und daher nicht benachrichtigt wurde. Dass es da noch eine Seite 2 gab, habe ich gerade erst festgestellt .... naja, Dusseligkeit! Wie natürlich auch die Frage nach der Silbentrennung, das ist mir auch etwas später aufgegangen.

Danke auch für die Links, ich werde sie mir mal ansehen.

Mein erster Versuch, ein eigenes Wörterbuch zu erstellen wird von OOo auch noch nicht anerkannt, mir fehlte dann aber die Zeit zum Probieren. Es wurde übrigens unter Linux (SUSE 9.2) mit OOo + Kwrite erstellt.

Eine Frage noch: Macht es eigentlich Sinn, "Linguistik", "Wörterbücher" + "Benutzerwörterbücher" in verschiedenen Verzeichnissen abzulegen? Ich halte es für sinvoller (habe es aber im Augenblick nur zum Teil umgesetzt) alles unter "Linguistik" zu setzen und dieses Verzeichnis wiederum meinem Arbeitsverzeichnis (nicht lokal, sondern im Netz) zuzuordnen. Erstens sind alle Einträge da auch bei Arbeiten an der Installation sicher, zweitens kann ich sie in unserem Netzwerk von jeder Arbeitsstation aus sowohl unter Windows als auch unter Linux benutzen.

Wie du siehst, habe ich da durchaus noch ein paar Unsicherheiten und würde mich über eine Klarheit schaffende Antwort freuen!

Gruß, Joke
OpenSUSE Leap 43, LibreOffice 6
Win7, LibreOffice 6
Antworten