ПОРІВНЯЛЬНЕ ДОСЛІДЖЕННЯ МЕТОДІВ МАШИННОГО НАВЧАННЯ ДЛЯ ПОТОКОВОЇ ОБРОБКИ ДАНИХ

Автор(и)

DOI:

https://doi.org/10.31891/2307-5732-2026-361-54

Ключові слова:

машинне навчання, Kafka, LightGBM, XGBoost, потокові дані

Анотація

Дослідження процесу аналізу потокових даних виявило, що класичні методи машинного навчання не справляються з обсягом, швидкістю та нелінійністю сучасних Big Data потоків. Головний результат – розроблення розподіленого пайплайну з архітектурою Feature Store, що дає змогу алгоритмам градієнтного бустингу досягти вищої прогностичної ефективності (R2 до 0,9998). На прикладі 1,33 млн записів, агрегованих для 100 пар, показано, що Feature Store із часовою стратифікованою вибіркою забезпечує зменшення обсягу даних у 5,7 разів та економію пам'яті близько 82%. Продемонстровано, що для високошвидкісних фінансових потоків комбінація ефективної агрегації даних та передових ансамблевих методів (LightGBM/XGBoost) є найкращою стратегією для забезпечення точності та обчислювальної ефективності.

Завантаження

Опубліковано

29.01.2026

Як цитувати

ХАМАР, І., & ОЛЕНИЧ, І. (2026). ПОРІВНЯЛЬНЕ ДОСЛІДЖЕННЯ МЕТОДІВ МАШИННОГО НАВЧАННЯ ДЛЯ ПОТОКОВОЇ ОБРОБКИ ДАНИХ. Herald of Khmelnytskyi National University. Technical Sciences, 361(1), 383-389. https://doi.org/10.31891/2307-5732-2026-361-54