Tento článek je pouze krátkým rozšířením předchozího článku o parsování XML dumpu Wikipedie. Ukáži kousek kódu, který umožní iterativní načítání XML za použití modulu ElementTree, který je nyní již standardní součástí Pythonu.
Archiv pro měsíc: Listopad 2014
Python: Parsování textu z Wikipedie
Dnešní zápisek se bude zajisté hodit každému, kdo pracuje v oblasti machine learningu a potřebuje zpracovat velké množství textu, které se nachází v současné Wikipedii. Ukáži pár kousků kódu, které vám usnadní začátek při získávání čistého textu z MediaWiki stránek. Pokračování textu Python: Parsování textu z Wikipedie