Ústav informačních systémů

Lemmiwinks framework, MozArch aplikace

Autoři:Serečun Viliam, Veselý Vladimír
Typ:software
Vznik:2018
Licence:vyžadována - zdarma
Klíčová slova:
Web archiving, Mozilla Archive Format, Web scraping, Web indexing, Lemmiwinks, MultiFunctional Index Scraping Tool
Popis:
Mnoho právních institucí vyžaduje důkazní břemeno týkající se webového obsahu. Tyto nástroje se zabývájí problémem spojeným s automatizací webové rekonstrukce a webovou archivací. Hlavním cílem je poskytnout řešení s s otevřeným zdrojovým kódem, které uspokojí právní instituce s jejich požadavky. Tato práce představuje dva hlavní produkty. První je framework Lemmiwinks, který je základním stavebním kamenem pro vývoj aplikací na extrakci a archivaci webových stránek. Druhým produktem je MozArch, prototyp ukazující využití frameworku. Výstupem MozArchi je soubor ve formátu MAFF, který obsahuje zrekonstruovanou webovou stránku, screenshot webové stránky a tabulku meta-informací jako jsou IP adresy, porty a časové razítko.
Umístění:
Zdrojové kódy k Lemmiwinks frameworku: https://github.com/nesfit/Lemmiwinks

Zdrojové kódy k MozArchive aplikaci: https://github.com/nesfit/mozarch
Výzkumné skupiny:
Pracoviště:
Licenční podmínky:
Softwary jsou nabízené pod MIT licencí

Vaše IPv4 adresa: 34.204.179.0
Přepnout na https