ОПТИМІЗАЦІЯ ОБРОБКИ СЛАБОСТРУКТУРОВАНИХ IoT-ДАНИХ НА ЕТАПІ ПЕРЕДОБРОБКИ У СИСТЕМАХ ВЕЛИКОГО ОБСЯГУ
DOI:
https://doi.org/10.31891/2307-5732-2026-361-8Ключові слова:
слабоструктуровані дані, оптимізація ресурсів, IoT, PySpark, Kubernetes, Big DataАнотація
У статті розглянуто задачу оптимізації обробки слабоструктурованих IoT-даних на етапі передобробки для систем великого обсягу. Проведено аналіз сучасних методів заповнення пропусків та обґрунтовано вибір середнього значення як найпростіший і найшвидший варіант для обробки потокових IoT-даних. На основі синтетичного набору з 10 000 JSON-записів імітовано типову ситуацію з пропусками у даних сенсорів. Методика реалізована з використанням PySpark, результати підтверджують ефективність обраного підходу: середній відсоток пропусків зменшено до нуля, а загальний час обробки скорочено.При проведенні комп’ютерних експериментів опрацювання слобоструктурованих даних використовувався процесор Apple M1.
Завантаження
Опубліковано
Номер
Розділ
Ліцензія
Авторське право (c) 2026 ВОЛОДИМИР МЕЛЬНИК (Автор)

Ця робота ліцензується відповідно до ліцензії Creative Commons Attribution 4.0 International License.