Pokročilé sémantické obohacování vícejazyčných kolekcí literárních textů

Název v angličtině:Distant Reading for European Literary History
Hlavní řešitel:Smrž Pavel
Agentura:Ministerstvo školství, mládeže a tělovýchovy České republiky - INTER-EXCELLENCE - Podprogram INTER-COST
Kód:LTC18054
Zahájení:2018-06-01
Ukončení:2021-10-31
Klíčová slova:Sémantika; Extrakce metadat
Anotace:
Cílem projektu je přispět k aktivitám COST Akce CA 16204 - Distant-Reading - v oblastech souvisejících se sémantickým obohacováním rozsáhlých souborů literárních textů v různých jazycích. Budeme zkoumat a vyvíjet pokročilé metody extrakce metadat a anotace obsahu, s cílem explicitní reprezentace široké škály sémantických struktur v textech, nové techniky adaptace stávajících zdrojů a nástrojů pro nové jazyky, oblasti a kontexty, a způsoby efektivní správy shromážděných zdrojů a kontroly jejich kvality a konzistence.

Publikace

2019FAJČÍK Martin, BURGET Lukáš a SMRŽ Pavel. BUT-FIT at SemEval-2019 Task 7: Determining the Rumour Stance with Pre-Trained Deep Bidirectional Transformers. In: Proceedings of the 13th International Workshop on Semantic Evaluation. Minneapolis, Minnesota: Association for Computational Linguistics, 2019, s. 1097-1104. ISBN 978-1-950737-06-2.

Vaše IPv4 adresa: 34.204.179.0