Kontakt

info@alvaria.sk

Najčastejšie chyby

Na základe súčasného stavu zverejňovania sme identifikovali najčastejšie chyby, ktoré sa vyskytujú pri zverejňovaní datasetov. Odporúčame samosprávam, aby sa týchto chýb vyvarovali alebo ich odstránili a tým zlepšili kvalitu a použiteľnosť svojich datasetov. Všetky chyby, ktoré treba či už manuálne alebo iným spôsobom opravovať znižujú použiteľnosť datasetov a odrádzajú používateľov od ich používania, keďže by museli venovať čas čisteniu dát. Napriek tomu je však lepšie zverejniť dáta s chybami ako vôbec. Ak existuje silný záujem a hodnota dát je vysoká, budú používatelia ochotní investovať čas do čistenia dát.

Nepresná kategorizácia

Pri kategorizovaní údajov je vhodné aby boli kategórie jasné, presné, konzistentné a aby sa neopakovali.

Príklady chybných kategorizácií (červená) (zdroj:Alvaria)

Preklepy/chyby

Preklepy najčastejšie vznikajú tým, že manuálne zadaný údaj je zle zapísaný, osoba ktorá ho vkladá sa dopustí chyby. Existujú viaceré spôsoby ako tieto chyby eliminovať:

  • nahradiť manuálne vkladanie údajov automatizovaným procesom  – nie vždy je to možné. Ak však už údaje existujú v elektronickej podobe, malo by byť možné ich importovať do datasetov.
  • kontrola údajov pri vkladaní – pri vkladaní sa údaje automaticky porovnávajú aby sa predišlo chybám,  – vhodné napríklad u dátumov.
  • manuálna kontrola, odporúčame využívať ak nie je možné použiť predchádzajúce metódy.
Príklad chyby: Chybne uvedený rok, ktorý zjavne nekorešponduje s ostatnými dátumami (zdroj: dataset Zmluvy mesta Žilina)

Chýbajúce dáta

Najčastejšie ide o tieto chyby:

  • nevyplnené údaje – niektoré údaje chýbajú, hoci sú podľa štruktúry datasetu očakávané, napríklad pri datasete zmluvy nie sú niektoré polia predmet zmluvy vyplnené
  • nedostupné údaje – údaj chýba v štruktúre datasetu, príkladom je zverejňovanie reklamných zariadení pri 2 mestách – Trnava a Žilina. Údaje mesta Žilina neobsahujú údaje o rozlohe reklamného objektu v m2, druhu stavebného objektu a a opis reklamného zariadenia, ktoré sú užitočné pre potenciálnych používateľov.

Chýbajúce metadáta

K datasetom je potrebné zverejniť aj metadáta – najmä popis údajov, dátum poslednej aktualizácie, licenciu, periodicitu aktualizácie a kontakt. Popis údajov by mal byť priebežne dopĺňaný, podľa otázok ktoré samospráva dostane na údaje je možné zistiť, čo je ešte používateľom údajov nejasné.

Nižšie uvádzame chyby, ktoré sme zistili pri už zverejňovaných konkrétnych datasetoch.

Zmluvy, faktúry a objednávky
Problémy Odporúčania
Zmluvy Kategorizácia zmlúv – kategórii je priveľa a vyskytuje sa tu veľa preklepov a duplicít. Odporúčame samosprávam vytvoriť si zoznam kategórií s jasnými pravidlami pre zamestnancov a ten pravidelne aktualizovať. Odporúčame tiež nepoužívať kategórie ako “zmluva”, “iná zmluva” alebo “dodatok”.
Nie je zrejmé, ktorá strana zmluvy je dodávateľ a ktorá odberateľ (napr. pri darovacej zmluve je potrebné vedieť kto je darca a kto obdarovaný). Odporúčame samosprávam zvoliť si znaky alebo systém na základe ktorého je možné identifikovať, či smeruje finančné plnenie od samosprávy, alebo k nej. Napr. zaradiť do údajov stĺpec, ktorý bude mať hodnotu napr. 0 alebo 1, pričom 0 znamená že finančné plnenie smeruje k samospráve a 1 od samosprávy, zadefinovať si poradie zmluvných strán alebo používať kladné a záporné hodnoty (+/-).
Vypĺňanie sumy – nie je správne vyplnená suma plnenia. Odporúčame samosprávam vypĺňať sumu, ktorá naozaj vyplýva samospráve zo zmluvy. Napr. pri dodatkoch pokiaľ sa mení suma zmluvy vpisovať len zmenu a nie novú sumu. Pri projektoch vpisovať len časť sumy, ktorú naozaj dostane samospráva, nie plnú sumu projektu.
Nie je uvedené či je zmluva hlavná alebo dodatok. Odporúčame samosprávam zaradiť do datasetu stĺpec s číslom hlavnej zmluvy, pokiaľ je zmluva dodatok.
Dataset neobsahuje odkaz na text zmluvy. Odporúčame samosprávam zaradiť odkaz na text zmluvy do datasetu.
Faktúry Nie je uvedený dátum vystavenia faktúry. Odporúčame samosprávam používať tento stĺpec ktorý je užitočný pre datovanie zmluvy.
Nie je uvedená či faktúra náleží k zmluve alebo objednávke. Odporúčame samosprávam uvádzať, ku ktorej zmluve či objednávke faktúra patrí, čo výrazne zjednoduší prepojenie datasetov.
Nie je uvedený predmet faktúry. Odporúčame samosprávam vždy uvádzať popis predmetu faktúry.
Objednávky Nie je uvedené číslo zmluvy, ku ktorej objednávka patrí. Odporúčame samosprávam uvádzať, ku ktorej zmluve či objednávka patrí, čo výrazne zjednoduší prepojenie datasetov.
Zmluvy/Faktúry/Objednávky Nie sú uvedené hlavičky údajov. Odporúčame samosprávam aby vždy v dátach uviedli názvy stĺpcov a zároveň pokiaľ nie je ich názov dostatočne vypovedajúci uviedli aj popis v metadátach.
Nie je zrejmé či údaje zahŕňajú aj údaje firiem založených mestom. Odporúčame samosprávam v metadátach k datasetom uviesť, či a ktoré mestom vlastnené firmy sú zahrnuté v údajoch. V prípade ak nie sú zahrnuté odporúčame samosprávam aby zaviazali firmy zverejňovať dáta.
Nie je správne vyplnený dátum. Často sa vyskytuje preklep v dátume, ktorý je ľahko detekovateľný (napr. rok 1907, 2044, 33.12. atď.). Odporúčame samosprávam používať software, ktorý dokáže na tieto chyby upozorniť.
Nie je uvedené IČO dodávateľa. Odporúčame samosprávam uvádzať pri dodávateľoch IČO, čím sa výrazne zjednodušuje spracovanie údajov.
Nie je uvedený názov organizácie. Odporúčame samosprávam uvádzať organizáciu a organizačnú zložku, ktorá zmluvu/faktúru/objednávku gestoruje.
Dotácie
Problém Odporúčanie
Údaje sú zverejnené len za posledný rok. Odporúčame samosprávam zverejniť údaje aj do minulosti.
Chýba údaj o adrese žiadateľov. Odporúčame samosprávam zverejniť aj údaj o adrese žiadateľa a IČO, čo umožňuje dotácie vizualizovať na mape.
Chýba údaj o požadovanej sume. Odporúčame samosprávam zverejniť aj údaj o požadovanej sume ku každej dotácie.