PDF DOM Parser

Autoři:Burget Radek
Typ:software
Vznik:2011
Licence:vyžadována - zdarma
Klíčová slova:PDF DOM HTML parser convertor java
Popis:
Pdf2Dom je parser PDF souborů který konvertuje dokumenty na HTML DOM reprezentaci. Získaný DOM strom může být serializován na HTML dokument nebo dále zpracován. Pro dosažení co možná největší podoby výsledného a zdrojového dokumentu jsou ve výsledném dokumentu využity vložené CSS definice. Součástí je rovněž nástroj pro konverzi PDF dokumentu na HTML stránky. Pdf2Dom může být použit rovněž jako nezávislá knihovna jazyka Java se standardním DOM rozhraním nebo jako alternativní parser pro renderovací stroj CSSBox, který rozšiřuje možnosti CSSBoxu o zpracování PDF souborů.
Umístění:
http://cssbox.sourceforge.net/pdf2dom
Výzkumné skupiny:
Pracoviště:
Licenční podmínky:
PDF DOM Parser je k dispozici zdarma pod licencí LGPLv3.