Типи даних

Текстові дані складаються із заголовків, параграфів, реквізитів, також можуть включати таблиці та ілюстрації. Прикладами текстових даних є нормативно-правові акти, розпорядчі документи, положення, програми, звіти, угоди. Для роботи з ними найчастіше використовуються редактори Microsoft Word, LibreOffice Writer, Google Документи. Рекомендовані формати оприлюднення текстових даних: DOC, DOCX, ODT, TXT, RTF та HTML.

Структуровані дані включають таблиці та ієрархічні дані, які містяться в базах даних. Це найбільш цінний тип відкритих даних, оскільки їх легко автоматично обробляти. 

Геопросторові дані описують положення географічних об'єктів на території. Наприклад, містобудівна документація, супутникові знімки, дані інтерактивних мап тощо. Існує два типи геопросторових даних: векторні (SHP, GeoJSON, KML, MID, MIF, ХML) та растрові (GeoTIFF).

Формати структурованих даних

Вибір формату набору найчастіше залежить від програмного забезпечення, в якому зберігаються дані. Формати структурованих даних умовно можна розділити на табличні (XLS, XLSX, ODS, CSV) та ієрархічні (JSON та XML).

Формати електронних таблиць (XLS, XLSX, ODS). Електронні таблиці (Microsoft Excel, LibreOffice Calc, Google Таблиці) — це найбільш поширене програмне забезпечення для роботи з наборами даних.

CSV (англ. comma separated values — значення, що розділені комою). Цей формат використовується для обміну даними між різним програмним забезпеченням. Для збереження CSV-файлів необхідно використовувати Google Таблиці або LibreOffice Calc. CSV-файли з Microsoft Excel не відповідають загальноприйнятому формату, оскільки використовують специфічне кодування операційної системи (Windows-1251 замість UTF-8) та розділювач крапку з комою замість коми.

JSON та XML. На відміну від табличних форматів, формати JSON та XML слугують для збереження ієрархічних даних. Часто такі формати використовуються для передачі даних в інтернеті. Наприклад, можна легко отримати звітність та договори зі spending.gov.ua й оприлюднити їх на data.gov.ua. Також ієрархічно структуровані дані у Prozorro, Інспекційному порталі, Єдиному державному реєстрі юридичних осіб, фізичних осіб-підприємців та громадських формувань. Для того, щоб обробляти та аналізувати такі набори, потрібно мати навички програмування.

API, Application Programming Interface (з англ. інтерфейс прикладного програмування). У контексті оприлюднення відкритих даних термін «API» означає спеціальний функціонал вебсервісів, що дає можливість оприлюднювати датасети автоматично (без участі розпорядника). Для отримання даних через API вебсервісів найчастіше використовуються запити у форматі гіперпосилань. Наприклад, завантажити перелік договорів Виконавчого комітету Запорізької міської ради (код ЄДРПОУ — 02140892) з Єдиного веб-порталу використання публічних фінансів (spending.gov.ua) можна за таким посиланням:

http://api.spending.gov.ua/api/v2/disposers/contracts?disposerId=02140892

 

Останні 8 цифр у посиланні — це код ЄДРПОУ розпорядника. Відповідно, змінюючи код ЄДРПОУ, можна отримувати дані нових розпорядників. 

Створення цього веб-ресурсу стало можливим завдяки підтримці американського народу, наданій через Агентство США з міжнародного розвитку ( USAID ) та за фінансової підтримки уряду Великобританії ( UK aid ). Окремі думки, висловлені в матеріалах, опублікованих на сайті не обов’язково відображають погляди Агентства USAID та Уряду США або Уряду Великобританії.

Портал працює в режимі дослідної експлуатації.

Адреса:

03150, м.Київ, вул. Ділова 24

Електронна пошта:

opendata@thedigital.gov.ua

© 2021 Міністерство цифрової трансформації України