1. Čo sú otvorené dáta a na čo sú dobré?

Nestretli ste sa ešte s pojmom otvorené dáta alebo nemáte presnú predstavu čo sa pod týmto pojmom myslí? Odpovede nájdete v tejto lekcii.

2. Načo sú mestám otvorené dáta?

Nie ste si istí, či je správne rozhodnutie zverejňovať otvorené dáta? Aké benefity to môže Vašej samospráve priniesť? Odpovede nájdete v tejto lekcii.

3. Ako otvárať dáta koncepčne?

Ste už rozhodnutí otvoriť svoje dáta ale neviete ako na to? Na čo všetko si dať pozor aby Vaše úsilie prinieslo úžitok? Odpovede nájdete v tejto lekcii.

4. Aké dáta zverejniť?

Viete už že chcete zverejňovať otvorené dáta a máte predstavu ako na to ale rozmýšľate nad tým aké dáta sú vhodné na zverejnenie? V tejto lekcii nájdete odpovede.

5. Ako zverejniť dáta technicky?

Ako zverejniť dáta efektívne? Aké sú vhodné formáty, licencie a technické riešenia? Odpovede nájdete v tejto lekcii.

7. Kde nájsť datasety?

Chceli by ste pracovať s otvorenými dátami ale neviete ako na to? V tejto lekcii predstavujeme prvý krok - kde hľadať otvorené dáta.

8. Zverejnenie dát v súlade s GDPR?

Ako zverejniť dáta tak aby to bolo v súlade s GDPR, ochranou osobných údajov a legislatívou? Odpovede sa dozviete v tejto lekcii.

11. Ako budovať komunitu?

Chcete aby nad Vašimi dátami vznikali riešenia? Aby boli používané, sťahované, aby sa o nich písalo? Ako na to vám odpovie táto lekcia.

12. Atribúty kvalitných dát?

Máte už zverejnené dáta ale nie ste si istí ich kvalitou? Ak nad Vašimi dátami nič dlhšie nevzniká, môže byť problémom aj ich kvalita. Ako na to Vám prezradíme v tejto lekcii.
Najčastejšie chyby

Na základe súčasného stavu zverejňovania sme identifikovali najčastejšie chyby, ktoré sa vyskytujú pri zverejňovaní datasetov. Odporúčame samosprávam, aby sa týchto chýb vyvarovali alebo ich odstránili a tým zlepšili kvalitu a použiteľnosť svojich datasetov. Všetky chyby ktoré treba či už manuálne alebo iným spôsobom opravovať znižujú použiteľnosť datasetov a odrádzajú používateľov od ich používania, keďže by museli venovať čas čisteniu dát. Napriek tomu je však lepšie zverejniť dáta s chybami ak vôbec. Ak existuje silný záujem a hodnota dát je vysoká, budú používatelia ochotní investovať čas do čistenia dát.

Nepresná kategorizácia

Pri kategorizovaní údajov je vhodné aby boli kategórie jasné, presné, konzistentné a aby sa neopakovali.

Príklady chybných kategorizácií (červená) (zdroj:Alvaria)

Preklepy/chyby

Preklepy najčastejšie vznikajú tým, že manuálne zadaný údaj je zle zapísaný, osoba ktorá ho vkladá sa dopustí chyby. Existujú viaceré spôsoby ako tieto chyby eliminovať:

  • nahradiť manuálne vkladanie údajov automatizovaným procesom  – nie vždy je to možné. Ak však už údaje existujú v elektronickej podobe, malo by byť možné ich importovať do datasetov.
  • kontrola údajov pri vkladaní – pri vkladaní sa údaje automaticky porovnávajú aby sa predišlo chybám,  – vhodné napríklad u dátumov.
  • manuálna kontrola, odporúčame využívať ak nie je možné použiť predchádzajúce metódy.
Príklad chyby: Chybne uvedený rok, ktorý zjavne nekorešponduje s ostatnými dátumami (zdroj: dataset Zmluvy mesta Žilina)

Chýbajúce dáta

Najčastejšie ide o tieto chyby:

  • nevyplnené údaje – niektoré údaje chýbajú, hoci sú podľa štruktúry datasetu očakávané, napríklad pri datasete zmluvy nie sú niektoré polia predmet zmluvy vyplnené
  • nedostupné údaje – údaj chýba v štruktúre datasetu, príkladom je zverejňovanie reklamných zariadení pri 2 mestách – Trnava a Žilina. Údaje mesta Žilina neobsahujú údaje o rozlohe reklamného objektu v m2, druhu stavebného objektu a a opis reklamného zariadenia, ktoré sú užitočné pre potenciálnych používateľov.

Chýbajúce metadáta

K datasetom je potrebné zverejniť aj metadáta – najmä popis údajov, dátum poslednej aktualizácie, licenciu, periodicitu aktualizácie a kontakt. Popis údajov by mal byť priebežne dopĺňaný, podľa otázok ktoré samospráva dostane na údaje je možné zistiť, čo je ešte používateľom údajov nejasné.

Nižšie uvádzame chyby, ktoré sme zistili pri už zverejňovaných konkrétnych datasetoch.

Zmluvy, faktúry a objednávky
 Problémy Odporúčania 
Zmluvy Kategorizácia zmlúv - kategórii je priveľa a vyskytuje sa tu veľa preklepov a duplicít. Odporúčame samosprávam vytvoriť si zoznam kategórií s jasnými pravidlami pre zamestnancov a ten pravidelne aktualizovať. Odporúčame tiež nepoužívať kategórie ako “zmluva”, “iná zmluva” alebo “dodatok”. 
Nie je zrejmé, ktorá strana zmluvy je dodávateľ a ktorá odberateľ (napr. pri darovacej zmluve je potrebné vedieť kto je darca a kto obdarovaný). Odporúčame samosprávam zvoliť si znaky alebo systém na základe ktorého je možné identifikovať, či smeruje finančné plnenie od samosprávy, alebo k nej. Napr. zaradiť do údajov stĺpec, ktorý bude mať hodnotu napr. 0 alebo 1, pričom 0 znamená že finančné plnenie smeruje k samospráve a 1 od samosprávy, zadefinovať si poradie zmluvných strán alebo používať kladné a záporné hodnoty (+/-).
Vypĺňanie sumy - nie je správne vyplnená suma plnenia. Odporúčame samosprávam vypĺňať sumu, ktorá naozaj vyplýva samospráve zo zmluvy. Napr. pri dodatkoch pokiaľ sa mení suma zmluvy vpisovať len zmenu a nie novú sumu. Pri projektoch vpisovať len časť sumy, ktorú naozaj dostane samospráva, nie plnú sumu projektu. 
Nie je uvedené či je zmluva hlavná alebo dodatok. Odporúčame samosprávam zaradiť do datasetu stĺpec s číslom hlavnej zmluvy, pokiaľ je zmluva dodatok.
Dataset neobsahuje odkaz na text zmluvy.Odporúčame samosprávam zaradiť odkaz na text zmluvy do datasetu.
FaktúryNie je uvedený dátum vystavenia faktúry. Odporúčame samosprávam používať tento stĺpec ktorý je užitočný pre datovanie zmluvy.
Nie je uvedená či faktúra náleží k zmluve alebo objednávke. Odporúčame samosprávam uvádzať, ku ktorej zmluve či objednávke faktúra patrí, čo výrazne zjednoduší prepojenie datasetov.
Nie je uvedený predmet faktúry. Odporúčame samosprávam vždy uvádzať popis predmetu faktúry.
Objednávky Nie je uvedené číslo zmluvy, ku ktorej objednávka patrí. Odporúčame samosprávam uvádzať, ku ktorej zmluve či objednávka patrí, čo výrazne zjednoduší prepojenie datasetov.
Zmluvy/Faktúry/Objednávky Nie sú uvedené hlavičky údajov. Odporúčame samosprávam aby vždy v dátach uviedli názvy stĺpcov a zároveň pokiaľ nie je ich názov dostatočne vypovedajúci uviedli aj popis v metadátach.
Nie je zrejmé či údaje zahŕňajú aj údaje firiem založených mestom. Odporúčame samosprávam v metadátach k datasetom uviesť, či a ktoré mestom vlastnené firmy sú zahrnuté v údajoch. V prípade ak nie sú zahrnuté odporúčame samosprávam aby zaviazali firmy zverejňovať dáta.
Nie je správne vyplnený dátum. Často sa vyskytuje preklep v dátume, ktorý je ľahko detekovateľný (napr. rok 1907, 2044, 33.12. atď.). Odporúčame samosprávam používať software, ktorý dokáže na tieto chyby upozorniť.
Nie je uvedené IČO dodávateľa. Odporúčame samosprávam uvádzať pri dodávateľoch IČO, čím sa výrazne zjednodušuje spracovanie údajov.
Nie je uvedený názov organizácie. Odporúčame samosprávam uvádzať organizáciu a organizačnú zložku, ktorá zmluvu/faktúru/objednávku gestoruje.
Dotácie
ProblémOdporúčanie
Údaje sú zverejnené len za posledný rok. Odporúčame samosprávam zverejniť údaje aj do minulosti.
Chýba údaj o adrese žiadateľov. Odporúčame samosprávam zverejniť aj údaj o adrese žiadateľa a IČO, čo umožňuje dotácie vizualizovať na mape.
Chýba údaj o požadovanej sume. Odporúčame samosprávam zverejniť aj údaj o požadovanej sume ku každej dotácie.