Семантико-зберігаюча міграція даних від реляційних до нереляційних баз даних на основі аналізу програмного коду

В.Р. Герасимов, аспірант,
e-mail: Ця електронна адреса захищена від спам-ботів. Вам необхідно увімкнути JavaScript, щоб побачити її.;
orcid.org/0009-0005-8514-8075
В.В. Душеба, канд. техн. наук
e-mail: Ця електронна адреса захищена від спам-ботів. Вам необхідно увімкнути JavaScript, щоб побачити її.;
orcid.org/0000-0002-8929-3625
Інститут проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України
Україна, 03164, Київ, вул. Олега Мудрака, 15

https://doi.org/10.15407/elmodel.48.03.053

Èlektron. model. 2026, 48(3):53-65

Дата надходження статті: 10.02.2026;
дата прийняття статті до друку після рецензування: 17.02.2026;
дата публікації (оприлюднення) статті: 28.05.2026

BY

В.Р. Герасимов, В.В. Душеба, 2026
Стаття поширюється на умовах ліцензії відкритого доступу CC BY 4.0

Повний текст: PDF

АНОТАЦІЯ

Запропоновано метод семантико-зберігаючої міграції даних із реляційних до нереля­цій­них баз даних, що зберігають інформацію в форматі JSON або подібного, який базується на інтелектуальному аналізі вихідного коду застосунку. На відміну від схемоорієнтованих підходів, метод використовує трансформацію, що зберігає семантику реалізовану з вико­ристанням великих мовних моделей для ідентифікації прихованих агрегатних меж та паттернів доступу на рівні ORM-метаданих за умови, що структура даних не відповідає вимогам третьої нормальної форми (3NF) або містить ознаки надмірності. Метод дозволяє детерміновано обирати стратегії вкладення (Embedding) або посилання (Referencing), спираючись на інженерію, що керована моделями, (Model Driven Engineering) з формаль­ною перевіркою узгодженості даних (consistency). Експериментально показано, що враху­вання прикладної логіки дозволяє зберегти узгодженість даних в визначені предметної області та підвищити швидкість виконання запитів на 60—85 % порівняно з недостатньо нормалізованими даними в реляційних базах даних. Метод охоплює складні етапи струк­турного рефакторингу при переході до документ-орієнтованих моделей даних.

КЛЮЧОВІ СЛОВА:

семантико-зберігаюча міграція даних; аналіз вихідного коду; нере­ляційні бази даних; інженерія, що керована моделями; великі мовні моделі; обʼєктно-ре­ляційне відображення (object relation mapping).

СПИСОК ЛІТЕРАТУРИ

  1. Sadalage P. J., Fowler M. NoSQL Distilled: A Brief Guide to the Emerging World of Polyglot Persistence. Boston : Addison-Wesley, 2012. 192 p. ISBN: 978-0321826626
  2. Akoka J., Comyn-Wattiau I. Roundtrip engineering of NoSQL databases // Enterprise Modelling and Information Systems Architectures (EMISAJ). 2018. Vol. 13.
  3. El Alami, A., Khourdifi, Y., Ait El Mouden, Z., Lahmer, M., & Hasnaoui, M. L. Migrating Relational Databases to NoSQL-Oriented Documents Using Object-Oriented Concepts // International Journal of Intelligent Engineering and Systems, 17(4).
  4. Chebotko A., Kashlev A., Lu S. A Big Data Modeling Methodology for Apache Cassandra // Proceedings of the IEEE International Congress on Big Data (BigData Congress 2015). IEEE, 2015. P. 238—245.
  5. Герасимов В.Р., Душеба В.В. Аналіз методів оптимізації роботи баз даних // Елект­ронне моделювання. 2024. Т. 46, № 6. С. 43—54.
  6. Brambilla M., Cabot J., Wimmer M. Model-Driven Software Engineering in Practice. 2-ге вид. Springer, 2017.
  7. Hou X., Zhao Y., Liu Y. та ін. Large Language Models for Software Engineering: A Systematic Literature Review // ACM Transactions on Software Engineering and Methodology. 2024. Vol. 33, No. 8. Article 220.
  8. Busch D., Bainczyk A., Smyth S., Steffen B. LLM-based code generation and system migration in language-driven engineering // International Journal on Software Tools for Technology Transfer. 2025. Vol. 27, no. 1. P. 137—147.
  9. MongoDB Documentation. Data Modeling Introduction. URL: https://www.mongodb.com/docs/manual/core/data-modeling-introduction/ (дата звернення: 15.11.2025).
  10. Amazon Web Services. SQL to NoSQL: Planning Your Migration. URL: https://docs.aws.amazon.com/amazondynamodb/latest/developerguide/SQLtoNoSQL.html (дата звернен­ня: 11.01.2026).
  11. Linares-Vásquez M., Li B., Vendome C., Poshyvanyk D. Documenting Database Usages and Schema Constraints in Database-Centric Applications // Proceedings of the 25th ACM SIGSOFT International Symposium on Software Testing and Analysis (ISSTA 2016). ACM, 2016. P. 270—281.
  12. Chen L., Davoudian A., Liu M. A workload-driven method for designing aggregate-oriented NoSQL database schemas // Data & Knowledge Engineering. 2022. Vol. 142. Article 102089.
  13. Li Y., Cuadrado J.S., Guerra E., de Lara J. A Unified Metamodel for NoSQL and Relational Databases // Proceedings of the 24th ACM/IEEE International Conference on Model Driven Engineering Languages and Systems (MODELS 2021 Companion). 2021. P. 165—174.
  14. Mihalcea V. High-Performance Java Persistence. Hypersistence SRL, 2024. ISBN 978-9730228236
  15. Buss C., Safari M., Termehchy A., Lee S., Maier D. Towards Scalable Schema Mapping using Large Language Models // Proceedings of the 4th International Workshop on Composable Data Management Systems (MIDAS 2025). 2025.

ГЕРАСИМОВ Владислав Ростиславович, аспірант Інституту проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України. У 2010 р. закінчив Національний авіаційний уні­верситет. Область наукових досліджень — реляційні та нереляційні бази даних.

ДУШЕБА Валентина Віталіївна, канд. техн. наук, доцент, зав. відділу математич­ного та компʼютерного моделювання Інституту проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України. У 1984 р. закінчила Київський інститут інженерів цивільної авіації. Область наукових досліджень — високопродуктивні архітектури та обчислення.