“Тексти” запрошують на воркшоп по роботі з даними ЄДР на Python.
ЄДР (Єдиний державний реєстр юридичних осіб та фізичних осіб підприємців і громадських формувань) – один із ключових наборів відкритих даних, який дає змогу проаналізувати стан розвитку бізнесу за регіонами, знайти інформацію про контрагентів та партнерів, а також об’єднати інформацію з десятків інших реєстрів.
На майстер-класі ми поговоримо про структуру ЄДР та дані, які з нього можна отримати. Проаналізуємо ЄДР на помилки та знайдемо рішення найбільш ймовірних проблем із якими ви можете стикатися під час самостійної роботи.
Також розповімо про інструменти аналізу даних у Python, попрацюємо із Pandas DataFrame та зробимо візуалізації за допомогою бібліотек matplotlib та seaborn. А ще побудуємо ефективний цикл обробки даних, який ви надалі зможете використовувати у своїх власних проєктах, та інтегруємо наш скрипт з SQL-базою даних.
☝Під час тренінгу ви навчитесь:
- будувати цикли роботи з відкритими даними, знаходити та виправляти помилки;
- автоматизувати роботу із ЄДР та аналізувати його в розрізі організаційно-правових форм, кодів виду економічної діяльності;
- будувати графіки та записувати дані до SQL-бази даних за допомогою Python;
- більше дізнаєтеся про відкриті дані та їхній розвиток в Україні;
- отримаєте практичний досвід аналізу даних.
?Ми будемо працювати з бібліотеками:
psycopg2, re, xml.etree.ElementTree, pandas, requests, numpy, seaborn.
?На тренінгу розглянемо такі теми:
- Pipeline роботи із відкритими даними;
- підключення до АРІ Data.gov.ua, завантаження даних;
- парсинг ЄДР із xml;
- очистка даних за допомогою регулярних виразів;
- валідація даних;
- аналіз та візуалізація даних;
- інтеграція із БД SQL.
?Для кого цей тренінг:
- для тих, кому необхідно працювати з ЄДР і потрібно автоматизувати свою роботу;
- для тих, хто хоче навчитися працювати з відкритими даними;
- для дата-журналістів, які бажають познайомитися з реальним кейсом роботи з даними мовою програмування Python;
- для аналітиків даних, які хочуть ближче познайомитися зі сферою відкритих даних в Україні.
Тренер: Денис Губашов – аналітик видання Texty.org.ua, консультант із впровадження політики відкритих даних.
Тривалість: 2 години
Формат: online, Zoom
Дата: 07 липня о 19:00
Реєстрація: https://bit.ly/python_edr до 6 липня включно.
Будемо вдячні, якщо учасники вебінару зроблять пожертву на розвиток ТЕКСТів у розмірі 500 грн за цим посиланням.
З усіма питаннями можна звернутися за електронною поштою d.hubashov@gmail.com, або за телефоном: (093) 704 80 03.