Pozrite si prezentáciu Lukáša Jankoviča o vizualizácii koronadotácií, ktorú sme pripravili spolu s Transparency International Slovensko. Dozviete sa ako a prečo vizualizácia vznikla, ako dlho to trvalo, ako funguje, aké dáta využíva, aká je kvalita vstupných dát a ďalšie zaujímavé informácie.

Vizualizácia Koronadotácie vznikla vďaka spolupráci Alvarie s Transparency International Slovensko (TIS).

TIS zbiera údaje o koronadotáciách, ktoré si žiada od ministerstiev a Ústredia práce na základe zákona o slobodnom prístupe k informáciám, keďže neexistuje centrálny bod, kde by boli zverejnené (niektoré ministerstvá ich nezverejňujú vôbec). Tie následne zverejňuje na svojej webovej stránke.

Dáta v aplikácii budú aktualizované približne raz za mesiac. Je dôležité upozorniť, že aplikácia neobsahuje všetky druhy pomoci, napríklad bankové záruky alebo iné nepriame druhy pomoci nie sú zahrnuté.

Dáta sú pomerne rozsiahle, preto nebolo v možnostiach Alvarie všetky dáta skontrolovať, vyčistili sme hlavne najväčšie problémy, napríklad zamenené IČO a názov subjektu.

Aplikácia obsahuje niekoľko pohľadov na dáta, ktoré sú bližšie opísané v článku TIS.

Aplikácia vznikla za necelé 3 mesiace, pred finálnou verziou, ktorá bola zverejnená 16.9.2021 existovalo niekoľko pracovných verzií.

V schéme Kultúrne dotácie chýba IČO, čo je dosť veľký problém z hľadiska ďalšieho spracovania dát a ich spájania s inými dátami. Je to však menšina dát, väčšina dát nemá tento problém.

Keďže v názvoch firiem sa vyskytujú preklepy, na spájanie dát bolo použité IČO.

Každá organizácia má vlastnú štruktúru dát, rôzne štruktúry je nutné najskôr zjednotiť aby bolo možné pracovať s dotáciami ako celkom.

Pri niektorých dátach sa vyskytuje zámena IČO a názvu subjektu. Pri niektorých záznamoch sme ručne IČO doplnil (minimum záznamov).

Dáta z Finstatu sú užitočné na to, aby sme vedeli dať výšku dotácií do kontextu – tržby firmy, pokles tržieb, zisk, odvetvie, SK NACE, počet zamesnancov, okres, kraj. Používali sme datasety organizácií, firiem a živnostníkov za roky 2020 a 2019.

Použili sme Power BI. Datasety boli pomerne rozsiahle, najrozsiahlejšie boli datasety Finstatu, ktoré sme zmenšili tým, že sme z nich vylúčili stĺpce, ktoré sme v aplikácii nepoužili. Tým sme zmenšili celkovú veľkosť vizualizácie, ktorá má 234 MB a 1,35 mil. riadkov (každý riadok reprezentuje jednu udelenú dotáciu).

Ak sa chcete dozvedieť zistenia z aplikácie, pozrite si: