!

Dette materialet blir ikke lenger vedlikeholdt. Du vil finne oppdatert materiale på siden: http://borres.hiof.no/wep/

lxml
Børre Stenseth
Python >lxml

lxml

Hva
Et Pythonbibliotek for blandt annet XSLT og XPATH.

lxml [1] er et bibliotek som gjør det mulig å utvide funksjonaliteten betraktelig når det gjelder XSLT-transformasjoner og XPATh i forhold tile det vi får til med standard Python. Vi skal se litt nærmere på mulighetene.

4Suite [2] er et annet bibliotek med tilsvarende muligheter. I skrivende stund, september 2012, ser det ut til at lxml er det biblioteket som vedlikeholdes og bygges ut, også for Python3.x

Vi skal se på noen av de viktigste (nyttigste) mulighetene som lxml tilbyr i de neste modulene. Vi bruker resultatfila fra olympiade-eksempelet som råmateriale, se modulene: Olympiade og Noen datasett . De aktuelle resultatene er ordnet i en XML-fil: all_results.xml

lxml må settes opp som angitt på lxml [1] .

Iterasjon
Validering
ElementPath
XPath
XSLT

Merk at lxml inneholder langt flere verktøy enn det som er beskrevet her. Blandt annet kan vi parse HTML og HTML5 og vi kan parse "råtne" HTML-dokumenter. Vi kan også søke i trær med CSS-selektorer. Det kommer flere eksempler når forfatteren får tid.

Referanser
  1. lxml - XML and HTML with Python lxml.de/ 03-08-2011
  1. 4Suite XML i Python 4Suite.org 4suite.org/index.xhtml 14-03-2010
Vedlikehold
Børre Stenseth, september 2012
( Velkommen ) Python >lxml ( Iterasjon )