КОМБІНОВАНИЙ МЕТОД ПАРТИЦІЮВАННЯ ТА ІНДЕКСУВАННЯ ДАНИХ ДЛЯ ПІДВИЩЕННЯ ЕФЕКТИВНОСТІ OLTP/OLAP СИСТЕМ

ВОЛОДИМИР СОЛОГУБ; ВОЛОДИМИР  ПАШКЕВИЧ

doi:10.31891/2307-5732-2025-359-62

Автор(и)

ВОЛОДИМИР СОЛОГУБ Національний університет «Львівська політехніка» Автор https://orcid.org/0000-0003-1553-530X
ВОЛОДИМИР ПАШКЕВИЧ Національний університет «Львівська політехніка» Автор https://orcid.org/0000-0002-6849-652X

DOI:

https://doi.org/10.31891/2307-5732-2025-359-62

Ключові слова:

OLTP, OLAP, підвищення ефективності SQL-запитів, партиціювання даних, бази даних, індекси

Анотація

Стаття присвячена вирішенню однієї з ключових проблем сучасних інформаційних систем — забезпеченню ефективної одночасної обробки транзакційних (OLTP) та аналітичних (OLAP) навантажень. Така потреба є критично важливою для бізнесу, що вимагає прийняття рішень на основі даних у реальному часі. Проведено глибокий аналіз обмежень традиційних підходів. З одного боку, системи, що покладаються виключно на індексування, демонструють високу продуктивність для точкових OLTP-запитів, але суттєво деградують при виконанні складних аналітичних запитів через значні накладні витрати на підтримку індексів та неефективне сканування даних. З іншого боку, стратегії, засновані лише на партиціюванні, хоч і прискорюють OLAP-запити шляхом відсікання зайвих блоків даних, часто є недостатньо гнучкими для швидкого доступу до окремих рядків, що є типовим для OLTP-операцій. Для подолання цих недоліків розроблено комбінований метод, що поєднує дворівневе партиціювання даних з адаптивною стратегією індексування. Перший рівень партиціювання виконується за часовим критерієм, що дозволяє логічно відокремити «гарячі» (актуальні) дані від «холодних» (історичних). Другий рівень, що застосовується в межах кожної часової партиції, базується на категоріальному критерії (наприклад, регіон, тип продукту), що додатково локалізує дані. Ключовою особливістю методу є адаптивне індексування: для активних, часто змінюваних партицій застосовуються легкі некластеризовані індекси, що мінімізують накладні витрати на операції запису (INSERT, UPDATE, DELETE). У той же час, для історичних партицій, які переважно використовуються для читання, індекси автоматично трансформуються у стовпцеві (column-store), що ідеально підходять для OLAP-запитів, оскільки забезпечують високий рівень компресії та мінімізують обсяг зчитування з диска. Для автоматизації життєвого циклу даних розроблено алгоритм, що динамічно управляє створенням нових партицій та зміною типів індексів. Алгоритм працює на основі заданих граничних значень, таких як обсяг даних у партиції та інтенсивність звернень, автоматично переводячи партиції зі стану «активних» у «історичні». Ефективність розробленого підходу була підтверджена експериментальним аналізом на синтетичній моделі даних, що імітувала діяльність великої торгової мережі. Результати показали, що комбінований метод дозволив досягти кількаразового прискорення виконання складних OLAP-запитів у порівнянні з системами, що використовують лише індекси або лише партиціювання, при цьому зберігши високу пропускну здатність для транзакційних операцій на рівні спеціалізованих OLTP-систем. Таким чином, розроблений метод забезпечує оптимальний баланс між швидкодією та масштабованістю, усуваючи конфлікт між двома типами навантажень, і може бути рекомендований для впровадження у сучасних високопродуктивних гібридних системах, де аналітика в реальному часі є бізнес-вимогою.

КОМБІНОВАНИЙ МЕТОД ПАРТИЦІЮВАННЯ ТА ІНДЕКСУВАННЯ ДАНИХ ДЛЯ ПІДВИЩЕННЯ ЕФЕКТИВНОСТІ OLTP/OLAP СИСТЕМ

Автор(и)

DOI:

Ключові слова:

Анотація

Завантаження

Опубліковано

Номер

Розділ

Ліцензія

Як цитувати

Мова

Зробити подання

Індексування

Прапор