Anmelden Register

Themabewertung:
  • 0 Bewertung(en) - 0 im Durchschnitt
  • 1
  • 2
  • 3
  • 4
  • 5
Konvertierung von HTML mit Hilfe von RegEx
#1
Konkret geht es um "normale" HTML-Seiten bei denen ich bestimmte Variablen rausfiltern will um diese dann anderweitig zu benutzen.
Beispiel:
Code:
<div class="xy">abc</div>

wie kann ich (am besten mit Python^^) und mit Hilfe von RegEx den String "abc" rausfiltern?

Ich bitte auch um Erklärung wie das funktioniert... RegEx ist für mich wie ein Buch mit 8 Siegeln.
#2
Ich würde hier nicht direkt mit RegEx sondern mit einem "dom parser" arbeiten.
hat zwei Vorteile: 1) es ist einfacher 2) es ist sicherer, d.h. es kann sich auch mal was am html ändern und es funktioniert immer noch

unter Python habe ich da mit Beautiful Soup gute Erfahrungen gemacht: http://www.crummy.com/software/BeautifulSoup/ (ich hoffe, das ist der richtige Link Smile)
#3
Danke dir. Ich hab mir die sie mal angeschaut, macht das was ich brauche. Jetzt muss ich nurnoch zeit finden das zu implementieren.




Benutzer, die gerade dieses Thema anschauen: 1 Gast/Gäste