uhuC
Konvertierung von HTML mit Hilfe von RegEx - Druckversion

+- uhuC (https://uhuc.de)
+-- Forum: uhuc Classic (https://uhuc.de/forum-43.html)
+--- Forum: Hilfeforum (https://uhuc.de/forum-5.html)
+--- Thema: Konvertierung von HTML mit Hilfe von RegEx (/thread-42.html)



Konvertierung von HTML mit Hilfe von RegEx - CyD - 25.04.2012

Konkret geht es um "normale" HTML-Seiten bei denen ich bestimmte Variablen rausfiltern will um diese dann anderweitig zu benutzen.
Beispiel:
Code:
<div class="xy">abc</div>

wie kann ich (am besten mit Python^^) und mit Hilfe von RegEx den String "abc" rausfiltern?

Ich bitte auch um Erklärung wie das funktioniert... RegEx ist für mich wie ein Buch mit 8 Siegeln.


RE: Konvertierung von HTML mit Hilfe von RegEx - slyx - 25.04.2012

Ich würde hier nicht direkt mit RegEx sondern mit einem "dom parser" arbeiten.
hat zwei Vorteile: 1) es ist einfacher 2) es ist sicherer, d.h. es kann sich auch mal was am html ändern und es funktioniert immer noch

unter Python habe ich da mit Beautiful Soup gute Erfahrungen gemacht: http://www.crummy.com/software/BeautifulSoup/ (ich hoffe, das ist der richtige Link Smile)


RE: Konvertierung von HTML mit Hilfe von RegEx - CyD - 26.04.2012

Danke dir. Ich hab mir die sie mal angeschaut, macht das was ich brauche. Jetzt muss ich nurnoch zeit finden das zu implementieren.