Uživatel:Juandev/Blog/Dekomprese informací

Z Wikiverzity

(28. února 2023)

Stejně tak jako se komprese informací ze špatně strukturovaného zdroje stává komplikovanou, tak se stává i dekomprese komplikovanou, pokud jsou například zdroje roztřítěné. Není žádným tajemstvím, že editorům Wikipedie, se daleko lépe kompiluje z dobře napsaných obsáhlých zdrojů, než ze špatně napsaných (to se týká struktury, ale i kompresního poměru) nebo roztroušených. U informací roztroušených v mnoha zdrojích musí totiž editor napřed tyto informace strukturalizovat do nějaké osnovy, pak vyřešit konflikty a pak se pokusit vytvořit kompilát. Nedej Bože, když nesebere na začátku všechny a musí kompilát několikrát celý přepisovat. V podstě podobné problémy nastávají u zdrojů větších, ale špatně strukturovaných, nebo obsahujících příliš nesouvisející látky. Na místo přímého psaní kompilátu, musí často editor pořídit výpisky, ty strukturalizovat a následně tvořit kompilát. V takových případech je to pak výrazně větší práce, zejména co do potřebného času na zpracování.

Data, tedy velmi roztříštěné informace[editovat]

Extrémním případem roztříštěnosti jsou data. Nicméně zde matematika vynalezla způsoby, jak je statistickou analýzou de fakto zjednodušit, strukturovaně srozumitelně popsat. Možná by se pak obdobné postupy daly použít na větší úseky textu obsahující určité zájmové informace.