HTML-Links als Text exportieren?

Setup und Komponenten-übergreifende Probleme.

Moderator: Moderatoren

zarniwoop
*
Beiträge: 13
Registriert: Mi, 11.03.2015 15:29

HTML-Links als Text exportieren?

Beitrag von zarniwoop » Do, 25.06.2015 12:27

Tach!
Ich habe eine relativ lange Liste mit Namen, die alle mit HTML-Links hinterlegt sind.

Kennt wer eine Möglichkeit, wie man diese Links GESAMMELT vom Text "entkoppeln" und als Text darstellen kann?
Das über den Menüpunkt "Hyperlink" zu machen, ist nicht gangbar, das sind deutlich über hundert Links!

Gibt es eine Möglichkeit, das Dokument als nacktes ASCII-Text-Format zu öffnen - weil dann müssten die Links ja eigentlich sichtbar sein?!

Danke für Tips!

Zarniwoop

Benutzeravatar
komma4
********
Beiträge: 5330
Registriert: Mi, 03.05.2006 23:29
Wohnort: Chon Buri Thailand Asia
Kontaktdaten:

Re: HTML-Links als Text exportieren?

Beitrag von komma4 » Do, 25.06.2015 12:52

Das scheint eine Aufgabe für einen HTML Parser zu sein.
Ich würde das dann in Python, bspw. mit BeautifulSoup machen.

Ein "Bordwerkzeug" in OpenOffice gibt es dafür nicht.
Cheers
Winfried
aktuell: LO 5.3.5.2 30m0(Build:2) SUSE rpm, unter Linux openSuSE Leap 42.3 x86_64/KDE5
DateTime2 Einfügen von Datum/Zeit/Zeitstempel (als OOo Extension)

Benutzeravatar
miesepeter
*******
Beiträge: 1606
Registriert: Sa, 10.05.2008 15:05
Wohnort: Bayern

Re: HTML-Links als Text exportieren?

Beitrag von miesepeter » Do, 25.06.2015 15:05

Du könntest mal versuchen, die Datei mit einem Packer zu öffnen (oder umbenennen in ZIP und dann öffnen) und dann die content.xml zu bearbeiten. Eventuell kann man mit Suchen > Suche alle alle Links herausfiltern und dann weiterverarbeiten.
Ciao

zarniwoop
*
Beiträge: 13
Registriert: Mi, 11.03.2015 15:29

Re: HTML-Links als Text exportieren?

Beitrag von zarniwoop » Do, 25.06.2015 16:15

Ich bin schon einen Schritt weiter: Über exportieren als HTML und dann anschließendes Importieren des HTML-Codes kommt man mit find/replace schließlich und endlich dahin, dass man sehr vieles bis auf die Zeilenumbrüche weg bekommt.

Dann aber das nächste nervige Problem: Das Ersetzen der (mehrfachen) Zeilenumbrüche geht scheinbar in OO nicht!
\n funktioniert nicht!

Hat da noch wer einen Tip?

Danke im Voraus

Zarniwoop

TrueColor
******
Beiträge: 542
Registriert: Do, 11.03.2010 11:23

Re: HTML-Links als Text exportieren?

Beitrag von TrueColor » Do, 25.06.2015 16:23

Suche nach doppelten Zeilenumbrüchen, ersetze durch einfache Zeilenumbrüche,
wiederhole, bis keine doppelten mehr gefunden werden.
System:
Arbeit: Windows 7 (64 bit) + Apache OpenOffice 4.1.2 (AOO412m3), LibreOffice 4.1.4.2
Home: Windows 10 (64 bit) + Apache OpenOffice 4.1.2 (AOO412m3)

zarniwoop
*
Beiträge: 13
Registriert: Mi, 11.03.2015 15:29

Re: HTML-Links als Text exportieren?

Beitrag von zarniwoop » Do, 25.06.2015 16:40

Nope - das lieferte bei mir nur "Kann Zeichen nicht finden"...

ABER DANN:
In einem älteren Thread den Hinweis auf folgende Extension gefunden:
http://extensions.services.openoffice.o ... /altsearch
Und damit scheint es zu gehen!

Yep!
Geht!
Klasse!

Danke erst mal

Zarniwoop

Antworten

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste