Набори даних для навчання та аналізу систем кіберзахисту цифрових підстанцій на основі методів штучного інтелекту

С.Я. Гільгурт, д-р техн. наук,
e-mail: Ця електронна адреса захищена від спам-ботів. Вам необхідно увімкнути JavaScript, щоб побачити її.;
orcid.org/0000-0003-1647-1790
А.В. Ковилін, аспірант,
orcid.org/0009-0001-6844-8931
Інститут проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України
Україна, 03164, Київ, вул. Олега Мудрака, 15

https://doi.org/10.15407/elmodel.48.03.044

Èlektron. model. 2026, 48(3):44-52

Дата надходження статті: 22.04.2026;
дата прийняття статті до друку після рецензування: 28.04.2026;
дата публікації (оприлюднення) статті: 28.05.2026

BY

С.Я. Гільгурт, А.В. Ковилін, 2026
Стаття поширюється на умовах ліцензії відкритого доступу CC BY 4.0

Повний текст: PDF

АНОТАЦІЯ

Робота присвячена огляду та порівняльному аналізу відкритих наборів даних для задач кіберзахисту цифрових електричних підстанцій на основі методів штучного інтелекту. Проаналізовано відкриті статті та тематичні репозиторії, що містять реальні файли мере­жевого трафіку, розмічені сценарії або інші дані, придатні для використання в задачах машинного навчання. Виконано порівняльний аналіз джерел за типом публікації, охопле­ними протоколами, формою подання даних, відкритістю інформації та загальною придат­ністю до подальшого ШІ-застосування. Показано, що найбільш часто у відкритому дос­тупі представлені набори, орієнтовані на протокол Generic Object Oriented Substation Events (GOOSE), тоді як багатопротокольні та Sampled Values (SV)-орієнтовані ресурси трапляються рідше. Зроблено висновок, що для сучасних ШІ-досліджень в сфері кіберза­хисту цифрових електричних підстанцій найбільш корисними є відкриті джерела, що поєднують наявність реальних файлів, вичерпний опис структури даних та безпосередню спрямованість на такі підстанції.

КЛЮЧОВІ СЛОВА:

цифрова електрична підстанція, кіберзахист, система виявлення вторгнень, штучний інтелект, набір даних, датасет-публікація.

СПИСОК ЛІТЕРАТУРИ

  1. Гильгурт С.Я. Анализ применения аппаратного ускорения информационной защиты в ав-томатизированных системах энергетической отрасли. Моделювання та інформаційні технології : зб. наук. пр. ІПМЕ ім. Г.Є. Пухова НАН України. 2018. № 83. С. 154—164. URL: http://nbuv.gov.ua/j-pdf/Mtit_2018_83_21.pdf
  2. Denial-of-Service attack on IEC 61850-based substation automation system: a crucial cyber threat towards smart substation pathways / S. Ashraf et al. Sensors. 2021. Vol. 21, no. 19. P. 6415. URL: https://doi.org/10.3390/s21196415 (date of access: 26.04.2026).
  3. Vulnerability and impact analysis of the IEC 61850 GOOSE protocol in the smart grid / H.T. Reda et al. Sensors. 2021. Vol. 21, no. 4. P. 1554. URL: https://doi.org/10.3390/s21041554 (date of access: 26.04.2026).
  4. Гільгурт С.Я. Огляд можливостей використання технологій штучного інтелекту для кіберзахисту цифрових підстанцій. Кібербезпека енергетики : Матеріали наук.-практ. конф. Ін-ту проблем моделювання в енергетиці ім. Г. Є. Пухова НАН України, м. Київ, 29 трав. 2024 р. Київ, 2024. С. 31—36. URL: https://ipme.kiev.ua/wp-content/uploads/2024/06/ Матеріали-КБЕ-2024.pdf.
  5. A survey on intrusion detection and prevention systems in digital substations / S.E. Quincozes et al. Computer networks. 2021. Vol. 184. P. 107679. URL: https://doi.org/1016/j.comnet.2020. 107679 (date of access: 26.04.2026).
  6. Lahza H., Radke K., Foo E. Applying domain-specific knowledge to construct features for detecting distributed denial-of-service attacks on the GOOSE and MMS protocols. International journal of critical infrastructure protection. 2018. Vol. 20. P. 48—67. URL: https://doi.org/10.1016/j.ijcip.2017.12.002 (date of access: 26.04.2026).
  7. A dataset to train intrusion detection systems based on machine learning models for electrical substations / E.D.G. Mlot et al. Data in brief. 2024. P. 111153. URL: https://doi.org/1016/ j.dib.2024.111153 (date of access: 26.04.2026).
  8. Dataset to train intrusion detection systems based on machine learning models for electrical substations / G.M.E. Damian et al. Zenodo. URL: https://zenodo.org/records/15487636 (date of access: 26.04.2026).
  9. PowerDuck: A GOOSE data set of cyberattacks in substations. arXiv.org. URL: https://arxiv.org/abs/2207.04716 (date of access: 26.04.2026).
  10. PowerDuck: A GOOSE data set of cyberattacks in substations / S. Zemanek et al. Zenodo. URL: https://zenodo.org/records/6974112 (date of access: 26.04.2026).
  11. GOOSE secure: A comprehensive dataset for in-depth analysis of GOOSE spoofing attacks in digital substations / O. A. Tobar-Rosero et al. Energies. 2024. Vol. 17, no. 23. P. 6098. URL: https://doi.org/10.3390/en17236098 (date of access: 26.04.2026).
  12. GitHub — CSCRC-SCREED/QUT-ZSS-2023-GOOSE: the datasets contain a wide variety of network and physical behaviours of an iec-61850-compliant zone substation. the datasets are compatible with actual substation network traffic, including benign GOOSE packets, MALICIOUS GOOSE packets, and benign SV packets. the datasets consist of two versions, including raw datasets and labelled datasets. GitHub. URL: https://github.com/CSCRC-SCREED/QUT-ZSS-2023-GOOSE (date of access: 26.04.2026).
  13. GitHub — CSCRC-SCREED/QUT-ZSS-2023-SV: the datasets contain a wide variety of network and physical behaviours of an iec-61850-compliant zone substation. the datasets are compatible with actual substation network traffic, including benign GOOSE packets, benign SV packets, and MALICIOUS SV packets. the datasets consist of two versions, including raw datasets and labelled datasets. GitHub. URL: https://github.com/CSCRC-SCREED/QUT-ZSS-2023-SV (date of access: 26.04.2026).
  14. GitHub — smartgridadsc/IEC61850SecurityDataset. GitHub. URL: https://github.com/smartgridadsc/IEC61850SecurityDataset (date of access: 26.04.2026).

ГІЛЬГУРТ Сергій Якович, д-р техн. наук, зав. відділу математичного та економетрич­ного моделювання Інституту проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України. В 1986 р. закінчив Київський інститут інженерів цивільної авіації. Область наукових досліджень — високопродуктивні та розподілені обчислювальні середовища, реконфігуровні обчислення на базі ПЛІС, сигнатурні засоби захисту інформації в кібер­фізичних системах та на об’єктах критичної інфраструктури.

КОВИЛІН Антон Володимирович, аспірант Інституту проблем моделювання в енерге­тиці ім. Г.Є. Пухова НАН України. В 2012 р. закінчив Національний авіаційний універ­си­тет. Область наукових досліджень — штучний інтелект, кібербезпека об’єктів критичної інфраструктури, виявлення аномалій у мережевому трафіку, графові нейронні мережі, прогнозування каскадних відмов в енергетичних мережах.