Що таке зв’язані дані?
Інтернет тривалий час розвивався як гігантське зібрання різноманітних документів, доступних через уніфіковані адреси — URL. Однак майже всі ці документи представлені у форматі, зручному для людського сприйняття і не є машиночитаними.
З кінця 1990-х — початку 2000-х років почався рух від мережі документів (Web of Documents) до мережі даних (Web of Data). Була створена низка технологій, які використовуються для оприлюднення зв’язаних даних та побудови семантичної павутини (Semantic Web). Найважливіші серед них RDF, SPARQL, JSON-LD, OWL, SHACL та SKOS.
У 2004 році W3C (World Wide Web Consortium (укр. Консорціум Всесвітнього павутиння)) оприлюднив першу версію моделі представлення даних Resource Description Framework або RDF (укр. середовище опису ресурсів), пізніше у 2008 році була представлена мова запитів для RDF — SPARQL. RDF та SPARQL — це ключові технології у сфері зв’язаних даних. RDF можна розглядати, як формат публікації даних у формі графів (мереж). SPARQL — це інструмент для маніпуляції з такими даними. Наприклад, він допомагає відфільтрувати, впорядкувати, трансформувати та агрегувати масиви зв'язаних даних.
У 2009 році був запущений data.gov.uk — один із перших порталів відкритих даних, створений з урахуванням принципів зв’язних даних. З 2011 по 2013 роки при W3C функціонувала Робоча група з урядових зв'язаних даних. Вона напрацювала низку словників для стандартизації наборів: DCAT, ADMS, Data Cube, People, ORG. З 2010 року ЄС впроваджує програми ISA та ISA², що спрямовані на посилання інтероперабельності публічних сервісів. У рамках програми ISA² були розроблені основні словники з електронного урядування та низка інших рішень з розвитку зв’язаних даних.
Україна започатковує розвиток зв’язаних даних, формуючи нормативну та технічну інфраструктуру. З 1 липня 2020 року набрали чинності базові словники ISA2 в галузі електронного урядування (Наказ ДП «УкрНДНЦ» № 124 від 14.05.2019). Вони допоможуть уніфікувати дані державних реєстрів та забезпечити їх оприлюднення у форматі RDF. Єдиний державний веб-портал відкритих даних та більшість місцевих порталів підтримують стандарт оприлюднення метаданих DCAT. Мінцифри надало рекомендації для оприлюднення наборів даних з Переліку, затвердженого Постановою КМУ №835 від 21.10.2015, у форматах зв'язаних даних. Рекомендації ґрунтуються на популярних базових словниках Core Public Organisation Vocabulary, The Organization Ontology, FOAF, Schema, SKOS.