Pozrite si prednášku Miroslava Babiča, autora portálov Uvostat a Otvorená Bratislava, kde hovorí o tom ako portál Otvorená Bratislava funguje a nad akými dátami je postavený.

Prednáška bola súčasťou workshopov “Otvorené dáta v mestách a krajoch – Nitra”, ktoré realizovalo občianske združenie Alvaria online v mesiacoch február – marec 2021.

Miroslav Babič je programátor a dátový špecialista. Pracuje v medzinárodnej korporácii, vo voľnom čase sa venuje verejnoprospešným dátovým projektom. Je autor portálu Uvostat.sk a  najnovšie aj portálu Otvorená Bratislava. 

Cieľom portálu Otvorená Bratislava je vizualizovať finančné dáta magistrátu, zjednodušiť vyhľadávanie vo faktúrach, objednávkach, zmluvách a poskytnúť užívateľom analytické pohľady na hospodárenie magistrátu. Prostredníctvom portálu získa používateľ komplexný prehľad o nakupovaní magistrátu. Portál obsahuje medziročné štatistiky nakupovania vzhľadom na objem financií a sektorov, informácie o dodávateľoch magistrátu,  či prehľadné vyhľadávanie vo faktúrach a objednávkach.

Portál je postavený nad niekoľkými dátovými zdrojmi:

  • opendata.bratislava.sk – portál otvorených dát Bratislavy, ktorý v súčasnosti obsahuje stovky datasetov. Na tomto mieste Bratislava zverejňuje zmluvy, objednávky, faktúry vo formáte otvorených dát,
  • finstat.sk –  prostredníctvom integrácie údajov z FinStatu je možné  analyzovať údaje o firmách aj podľa SK NACE
  • uvostat.sk – portál obsahuje údaje o obstarávaniach

Pri vývoji portálu narazil Miroslav Babič na niekoľko výziev z hľadiska spracovávania dát.  Jednou z nich je nejednotná štruktúra – štruktúra súborov sa mení v čase, mení sa typ súborov, v niektorých prípadoch sú aj PDF súbory. Tieto dáta je potom zložité spájať.  Ďalšou výzvou je  nekonzistentnosť v  názvosloví – tie isté položky sú zapísané rozdielne.  Problémom API, ktoré poskytuje mesto je že neobsahuje údaje ktoré sú v datasetoch ale len zoznam datasetov a metadáta. Ak by ich obsahovalo zrejme by boli už vyčistené. Autor dostal od mesta prísľub riešenia, bez konkrétneho dátumu. Častý problém je manuálne vkladanie dát a z toho prameniace chyby.

Vyvarovať sa týmto chybám je možné aj vďaka týmto krokom, ktoré Miroslav Babič odporúča:

  • nastaviť štruktúru datasetov na začiatku,
  • čistiť dáta už pred vkladaním do systému – problémom je práca so súbormi a neexistencia databáz,
  • automatizovať procesy – odstránenie rizika ľudskej chyby,
  • nebáť sa prebrať dobré nápady od iných – výborným príkladom API je práve Register partnerov verejného sektora, ktorý funguje veľmi dobre.

Autor projektu už dnes rozmýšľa nad ďalším vývojom portálu. Jeho plánom je dáta analyzovať a výsledky spracovávať do  blogov. Ďalším cieľom je pridať porovnanie dát s rozpočtom, ktorý Bratislava taktiež zverejňuje vo formáte otvorených dát.

Pozrite si celú prednášku Miroslava Babiča a dozviete sa ďalšie užitočné informácie.