ЗАСТОСУВАННЯ МОДЕЛЕЙ МАШИННОГО НАВЧАННЯ ДЛЯ ПРОГНОЗУВАННЯ ЦІН НА РИНКУ НЕРУХОМОСТІ
DOI:
https://doi.org/10.31891/2307-5732-2022-315-6-170-178Ключові слова:
машинне навчання, регресійні моделі, ціна нерухомості, економічні моделі, кластеризація данихАнотація
В роботі наведено результати використання машинного навчання для прогнозування змін цін на ринку нерухомості. Проаналізовано економічні моделі та чинники, що впливають на формування ціни. Ці дані використано як основу для побудови моделі машинного навчання. Особлива увага зосереджена на виборі базових даних для побудови такої моделі. Проаналізовано різні типи регресійних моделей, які можуть бути реалізовані у відповідних програмних середовищах. В кінцевому результаті створена статистична модель для прогнозування ціни на житло за допомогою лінійної регресії. Вона використана для визначення тенденцій змін цін на ринку нерухомості в середньостроковому і довгостроковому періодах. Детально розглянуто всі бібліотеки, які використовуються в розробці статистичної моделі, проаналізовано їх переваги та недоліки. Розглянуто та реалізовано наступні кроки створення моделі: імпорт бібліотек та модулів, розроблено зчитування даних з датасету, аналіз даних, очистка та середня статистична оцінка. Як результат, лінійну регресію використано для аналізу масиву даних, отриманих з відкритого ресурсу – сайту продажу та оренди нерухомості Zillow. Об’єкти нерухомості. Описані на цьому ресурсі, стосуються міста Сіетл. Використано кластеризацію за основними параметрами об’єктів нерухомості, зокрема площею, розміщенням, віком. Щоб оцінити співвідношення різноманітних характеристик об’єкта нерухомості проведено 3D-моделювання з використанням конструктора Axes3D. На основі аналізу виконана візуалізація даних з використанням різних бібліотек. Аналізовані дані відображено на карті за допомогою Folium. Реалізовано кластеризацію даних та тестування на реальних даних, що показало доволі непогані результати прогнозу ціни. Отриманий результат моделювання перевірено на реальних об’єктах нерухомості та встановлено, що точність роботи такої моделі становить 76%. Такий високий результат вказує на правильність її побудови та раціональність використання програмних рішень для її втілення. Вона в майбутньому може бути використана для аналізу подібних масивів даних в цій галузі.
Завантаження
Опубліковано
Номер
Розділ
Ліцензія
Авторське право (c) 2022 Олег ПАШКЕВИЧ, Сергій ВАЩИЩАК, Андрій БОЙЧУК, Тарас СТИСЛО, Микола ДЕМЧИНА (Автор)

Ця робота ліцензується відповідно до ліцензії Creative Commons Attribution 4.0 International License.