Jan Švec | honzas.cz
Menu

# Digitální humanitní vědy

2 položky

Všechny štítky

Získávání metadat ze skenovaných dokumentů NATO pomocí LLM

2. června 2026

Historické archivy obsahují cenné informace, ale ve skenovaných dokumentech se obtížně hledá, pokud jsou metadata neúplná nebo nekonzistentní. Na C4DHI Anniversary Workshop jsem představil pracovní postup, který využívá velké jazykové modely k získávání strukturovaných metadat ze skenovaných archivních dokumentů NATO. Přednáška se zaměřila na zašuměné OCR, vícejazyčné záznamy a zachování podkladů pro lidskou kontrolu.

Portrétní náhled programu workshopu C4DHI

Agentní AI pro digitální humanitní vědy

26. dubna - 12. května 2026

Složitější výzkumné úlohy se nevejdou do jednoho promptu: potřebují nástroje, kontrolu mezivýsledků a dohledatelnou posloupnost kroků. Materiály z workshopu představují agentní AI jako pracovní postup pro digitální humanitní vědy a archivní výzkum. Propojují výzkumný pobyt v Oxfordu, spolupráci v rámci CLARIN a praktickou práci s archivními dokumenty NATO.

Portrétní náhled prezentace Agentic AI Introduction