ПОРІВНЯЛЬНЕ ДОСЛІДЖЕННЯ МЕТОДІВ МАШИННОГО НАВЧАННЯ ДЛЯ ПОТОКОВОЇ ОБРОБКИ ДАНИХ
DOI:
https://doi.org/10.31891/2307-5732-2026-361-54Ключові слова:
машинне навчання, Kafka, LightGBM, XGBoost, потокові даніАнотація
Дослідження процесу аналізу потокових даних виявило, що класичні методи машинного навчання не справляються з обсягом, швидкістю та нелінійністю сучасних Big Data потоків. Головний результат – розроблення розподіленого пайплайну з архітектурою Feature Store, що дає змогу алгоритмам градієнтного бустингу досягти вищої прогностичної ефективності (R2 до 0,9998). На прикладі 1,33 млн записів, агрегованих для 100 пар, показано, що Feature Store із часовою стратифікованою вибіркою забезпечує зменшення обсягу даних у 5,7 разів та економію пам'яті близько 82%. Продемонстровано, що для високошвидкісних фінансових потоків комбінація ефективної агрегації даних та передових ансамблевих методів (LightGBM/XGBoost) є найкращою стратегією для забезпечення точності та обчислювальної ефективності.
Завантаження
Опубліковано
Номер
Розділ
Ліцензія
Авторське право (c) 2026 ІВАН ХАМАР, ІГОР ОЛЕНИЧ (Автор)

Ця робота ліцензується відповідно до ліцензії Creative Commons Attribution 4.0 International License.