von Grüne_Wiese_1900 » Di, 27.01.2015 16:05
Hallo,
ich habe zwei Probleme beim Umzug eines Projektes von Calc nach Base:
hier möchte ich Problem 2 schildern. Problem 1 habe ich hier geschildert:
viewtopic.php?f=8&t=65292
Es geht um eine Tabelle, aus der vorher alle identischen Dupletten rausgefiltert wurden, in der aber noch unterschiedliche Schreibweisen enthalten sind, welche von Hand aussortiert werden müssen. (Siehe Beispiel unten). Dabei nun die Annahme, dass sich die verschiedenen Schreibweisen nicht wesentlich in der Länge des Textes unterscheiden und bei alphabetischer Sortierung direkt unterereinander erschienen. Mit dieser Annahme hatte ich in Calc folgende Formel gebaut: F2=ODER(E2<3;F2<3) mit D2=ABS(länge(b2)-länge(b3)) und E2=ABS(länge(b2)-länge(b1)). Diese Formel zeigt mir also alle "Duplikat verdächtigen" Einträge. Wenn man dann Nach F und anschließend nach Begriff sortiert wird kann man ganz komfortabel alle, welche die maschinelle Duplikatsuche nicht ausgefiltert hat, von Hand "nach screenen".
Code: Alles auswählen
+---+----+---------+--------+-----------+---+---+---+
| | A | B | C | D | D | E | F |
+---+----+---------+--------+-----------+---+---+---+
| 1 | ID | Begriff | Quelle | Kommentar | | | |
+---+----+---------+--------+-----------+---+---+---+
| 2 | 1 | Schief | A | xyz | | | |
+---+----+---------+--------+-----------+---+---+---+
| 3 | 2 | Esel | A | abc | | | |
+---+----+---------+--------+-----------+---+---+---+
| 4 | 3 | Schiff | B | hjk | | | |
+---+----+---------+--------+-----------+---+---+---+
| 5 | 4 | Eßel | B | asf | | | |
+---+----+---------+--------+-----------+---+---+---+
| 6 | 5 | Schif-f | A | | | | |
+---+----+---------+--------+-----------+---+---+---+
Moderation: Zur übersichtlichen Darstellung der Tabelle im Text [code][/code] Tags gesetzt.—lorbass, Moderator
Ich würde mich sehr freuen, hier Hilfe zu finden.
Viele Grüße
Hallo,
ich habe zwei Probleme beim Umzug eines Projektes von Calc nach Base:
hier möchte ich Problem 2 schildern. Problem 1 habe ich hier geschildert: http://de.openoffice.info/viewtopic.php?f=8&t=65292
Es geht um eine Tabelle, aus der vorher alle identischen Dupletten rausgefiltert wurden, in der aber noch unterschiedliche Schreibweisen enthalten sind, welche von Hand aussortiert werden müssen. (Siehe Beispiel unten). Dabei nun die Annahme, dass sich die verschiedenen Schreibweisen nicht wesentlich in der Länge des Textes unterscheiden und bei alphabetischer Sortierung direkt unterereinander erschienen. Mit dieser Annahme hatte ich in Calc folgende Formel gebaut: F2=ODER(E2<3;F2<3) mit D2=ABS(länge(b2)-länge(b3)) und E2=ABS(länge(b2)-länge(b1)). Diese Formel zeigt mir also alle "Duplikat verdächtigen" Einträge. Wenn man dann Nach F und anschließend nach Begriff sortiert wird kann man ganz komfortabel alle, welche die maschinelle Duplikatsuche nicht ausgefiltert hat, von Hand "nach screenen".
[code]+---+----+---------+--------+-----------+---+---+---+
| | A | B | C | D | D | E | F |
+---+----+---------+--------+-----------+---+---+---+
| 1 | ID | Begriff | Quelle | Kommentar | | | |
+---+----+---------+--------+-----------+---+---+---+
| 2 | 1 | Schief | A | xyz | | | |
+---+----+---------+--------+-----------+---+---+---+
| 3 | 2 | Esel | A | abc | | | |
+---+----+---------+--------+-----------+---+---+---+
| 4 | 3 | Schiff | B | hjk | | | |
+---+----+---------+--------+-----------+---+---+---+
| 5 | 4 | Eßel | B | asf | | | |
+---+----+---------+--------+-----------+---+---+---+
| 6 | 5 | Schif-f | A | | | | |
+---+----+---------+--------+-----------+---+---+---+[/code][color=#00AA00][size=85][b]Moderation:[/b] Zur übersichtlichen Darstellung der Tabelle im Text [code][/code] Tags gesetzt.—lorbass, Moderator[/size][/color]
Ich würde mich sehr freuen, hier Hilfe zu finden.
Viele Grüße