ТЕКСТИ запрошують на воркшоп «Робота з даними ЄДР на Python»

23/06/2021

“Тексти” запрошують на воркшоп по роботі з даними ЄДР на Python.

ЄДР (Єдиний державний реєстр юридичних осіб та фізичних осіб підприємців і громадських формувань) – один із ключових наборів відкритих даних, який дає змогу проаналізувати стан розвитку бізнесу за регіонами, знайти інформацію про контрагентів та партнерів, а також об’єднати інформацію з десятків інших реєстрів.

На майстер-класі ми поговоримо про структуру ЄДР та дані, які з нього можна отримати. Проаналізуємо ЄДР на помилки та знайдемо рішення найбільш ймовірних проблем із якими ви можете стикатися під час самостійної роботи.

Також розповімо про інструменти аналізу даних у Python, попрацюємо із Pandas DataFrame та зробимо візуалізації за допомогою бібліотек matplotlib та seaborn. А ще побудуємо ефективний цикл обробки даних, який ви надалі зможете використовувати у своїх власних проєктах, та інтегруємо наш скрипт з SQL-базою даних.

☝Під час тренінгу ви навчитесь:

  • будувати цикли роботи з відкритими даними, знаходити та виправляти помилки;
  • автоматизувати роботу із ЄДР та аналізувати його в розрізі організаційно-правових форм, кодів виду економічної діяльності;
  • будувати графіки та записувати дані до SQL-бази даних за допомогою Python;
  • більше дізнаєтеся про відкриті дані та їхній розвиток в Україні;
  • отримаєте практичний досвід аналізу даних.

💻Ми будемо працювати з бібліотеками:

psycopg2, re, xml.etree.ElementTree, pandas, requests, numpy, seaborn.

💡На тренінгу розглянемо такі теми:

  • Pipeline роботи із відкритими даними;
  • підключення до АРІ Data.gov.ua, завантаження даних;
  • парсинг ЄДР із xml;
  • очистка даних за допомогою регулярних виразів;
  • валідація даних;
  • аналіз та візуалізація даних;
  • інтеграція із БД SQL.

👩Для кого цей тренінг:

  • для тих, кому необхідно працювати з ЄДР і потрібно автоматизувати свою роботу;
  • для тих, хто хоче навчитися працювати з відкритими даними;
  • для дата-журналістів, які бажають познайомитися з реальним кейсом роботи з даними мовою програмування Python;
  • для аналітиків даних, які хочуть ближче познайомитися зі сферою відкритих даних в Україні.

Тренер: Денис Губашов – аналітик видання Texty.org.ua, консультант із впровадження політики відкритих даних.

Тривалість: 2 години

Формат: online, Zoom

Дата: 07 липня о 19:00

Реєстрація: https://bit.ly/python_edr до 6 липня включно.

Будемо вдячні, якщо учасники вебінару зроблять пожертву на розвиток ТЕКСТів у розмірі 500 грн за цим посиланням.

З усіма питаннями можна звернутися за електронною поштою d.hubashov@gmail.com, або за телефоном: (093) 704 80 03.

Створення цього веб-ресурсу стало можливим завдяки підтримці американського народу, наданій через Агентство США з міжнародного розвитку ( USAID ) та за фінансової підтримки уряду Великобританії ( UK aid ). Окремі думки, висловлені в матеріалах, опублікованих на сайті не обов’язково відображають погляди Агентства USAID та Уряду США або Уряду Великобританії.

Портал працює в режимі дослідної експлуатації.

Адреса:

03150, м.Київ, вул. Ділова 24

Електронна пошта:

opendata@thedigital.gov.ua

© 2021 Міністерство цифрової трансформації України