Kontakt

info@alvaria.sk

Slovníček pojmov

Uvedené pojmy sa v kurze často vyskytujú, preto je dobré vedieť, čo je nimi myslené aby nevznikali nedorozumenia a nepochopenie.

Otvorené dáta (open data) – koncept zverejňovania informácií, ktorý umožňuje prístup cez internet v otvorenom a strojovo spracovateľnom formáte, pričom spôsob a účel použitia informácií nie je obmedzený   

Dataset (v širšom netechnickom význame) – množina štruktúrovaných údajov vzťahujúca sa k jednej vecnej téme (nie nevyhnutne jeden počítačový súbor) 

Príklady:

  • Zmluvy
  • Faktúry
  • Objednávky
  • Verejné obstarávanie
  • Ulice
  • Evidencia psov
  • Adresy
  • Počet prihlásených psov podľa adresy

Počítačový súbor – množina súvisiacich údajov uložená na počítačovom disku alebo inom médiu, ktorá má priradený názov a formát, napr. “subor.txt” je počítačový súbor s názvomsubor” a formátom TXT 

Dátový súbor (dataset v technickom zmysle) – počítačový súbor obsahujúci štruktúrované údaje. Štruktúrovanosť údajov nie je čiernobiela, údaje môžu byť viac alebo menej štruktúrované. Predstavme si ju ako viac alebo menej “upratané údaje”. Napríklad tabuľka je štruktúrovanejšia ako obrázok, tabuľka s vyplnenými názvami záhlaví je ešte viac štruktúrovaná ako bez  nich. Ešte viac štruktúrované dáta sú vo formátoch JSON alebo XML.

Formát – spôsob resp. štruktúra, akým sú údaje v počítačovom súbore zaznamenané. Tie isté údaje môže byť zaznamenané v rozličných formátoch. 

Príklad zobrazenia súborov v MS Windows. Formáty súborov sú vypísané v stĺpci “Typ” (zdroj: Alvaria)

Strojovo spracovateľné dáta – štruktúrované dáta, ktoré vie jednoducho a automatizovane spracovať počítač. Dáta musia byť štruktúrované aby ich vedel počítač automatizovane spracovať. Formát je pre počítač návod, ako dáta prečítať. Ak je formát otvorený, vedia tvorcovia počítačových programov zadarmo naučiť svoj program, ako pracovať so súbormi s týmto formátom.

Príklady strojovo spracovateľných formátov najčastejšie používaných pre zverejnenie otvorených dát (zdroj: uxwing.com, koláž)

API– aplikačné programované rozhranie (z anglického application programming interface), interakcia medzi rôznymi počítačovými programami, zjednodušene je to technológia pomocou ktorej si medzi sebou počítačové programy cez internet v reálnom čase posielajú dáta 

Licencia – právny režim použitia údajov (akým spôsobom a za akým účelom je možné legálne dáta využívať)

Vizualizácia (vizualizovanie dát) – vytváranie grafov alebo máp z dát, pridávanie možností interakcie používateľa (filtre, zmena zobrazenia, zmena mierky, atď.)