Предсказание цен на недвижимость с помощью Big Data

03.03.2016 1522
Количество просмотров
#Разработка

В условиях кризиса на рынке недвижимости снижается спрос на квартиры. Вместе с этим растут цены на отдельные предложения. Это связано с человеческой психологией - одни стараются продать квартиру на падающем рынке и понижают цену в надежде привлечь оставшихся покупателей, другие пытаются компенсировать нестабильность рубля и рост потребительских цен, завышая стоимость недвижимости. Рынок недвижимости крайне неоднороден.


Решение - разработка обучаемой системы оценки стоимости объектов недвижимости (в частности квартир), которая, проанализировав объявления в интернете, сможет оценивать их реальную стоимость. Клиент - условное агентство недвижимости, которому нужно автоматизировать процесс определения рыночной стоимости квартир и анализа рынка.


Задача сводится к мониторингу объявлений рынка недвижимости и обучению системы по ним (мы ее назвали РиэлтПред). Когда системе предоставляются на анализ новые объявления, она должна оценить предложение и вынести вердикт, справедлива ли цена или нет, привести аргументы за и против. Мы имеем большой опыт в разработке подобных систем.

При анализе рынка РиэлтПред необходимо обработать порядка 120 000 объявлений. В каждом объявлении 3-5 изображений и около 20 параметров, влияющих на цену. Это то, что мы очень любим - большие данные, ОЧЕНЬ большие данные (Big data  в чистом виде).


Обработка больших данных определяет зависимость цен на недвижимость в зависимости от указанных в объявлении параметров и выявляет ситуацию на рынке. Цель - получить объективную оценку стоимости жилья.

Алгоритм работы системы

РиэлтПред собирает объявления с самых популярных площадок о продаже и покупке недвижимости: ЦИАН, Авито, часть Яндекс.Недвижимость (так как Я.Н является больше аггрегатором нежели площадкой). С помощью композиции алгоритмов (таких как TF-IDF и градиентный бустинг, о них поговорим подробнее в следующей статье), РиэлПред находит закономерности в цене объявлений и выясняет влияние харакетристик недвижимости на цену. По полученным сведениям системы оценивает вновь поступаемые объявления на предмет выгодности покупки.


Например, если квартира на ЦИАН стоит 9 млн, а ее среднерыночная цена — 10 млн, то  можно заработать миллион на выгодной сделке без особых проблем. В случае завышенной стоимости программа укажет на негативные параметры объявления, риэлтор оценит объект и укажет предварительную стоимость жилья без визита на объект.

Параметры оценки жилья

РиэлтПред оценивает важность всех характеристик объектов недвижимости и их влияние на итоговую цену.


Предположим, в системе указан параметр оценки жилья "близость к метро". 15 минут ходьбы до станции для одного человека могут оцениваться так же, как и 5 минут для другого. Система рассчитывает стоимость объекта в зависимости от расстояния, используя указанные геоданные.


Тип дома - также очень важный параметр. Квартира в панельном доме серии КОПЭ дороже, чем в доме серии И-15, даже в силу возраста домов. Квадратный метр в домах серии П-44, дороже чем в КОПЭ. Дома с индивидуальными планировками ценятся еще выше, так как они зачастую обладают качественной отделкой и современной инфраструктурой.


Сильно влияет на оценку объектов и размещение на этажах. Квартиры на первом этаже продаются на 10% дешевле, так же как и на последнем, без технического этажа.


Не стоит забывать о вторичном жилье и новостройках. Квартиры в новых домах — не всегда выгодная сделка, т. к. часто не являются основным жильем собственников, и они редко идут на уступки. Жилье во «вторичках» обустроено для въезда «здесь и сейчас», а потому есть шансы на быструю и выгодную сделку.


Собственники  склонны завышать стоимость на жилье. Допустим, продавец продает квартиру с хорошим ремонтом на 500 000 выше рыночной стоимости, желая окупить стоимость ремонта годовалой давности на 100%, в то время как покупатели склонны менять ремонт в первый год  после покупки жилья. Программа собирает текстовые объявления со словом «евроремонт» и выдает стоимость квартиры по объявлению наряду с указанной среднерыночной стоимостью жилья. Риэлтор выезжает на объект, оценивает квартиру по всем параметрам и указывает реальную цену.

Борьба с мошенничеством

К сожалению, рынок недвижимости является одним из самых мошеннических. Существует множество серых схем, которые тяжело анализировать на этапе анализа объявлений. Нередки объявления-приманки с фиктивными фотографиями и заниженной ценой, когда недобросовестные риэлторы указывают неправильный адрес для завлечения. Но мы отлавливаем такие “мусорные” объявления на раннем этапе: анализируем схожесть текстов, проверяем дубли фотографий, помещаем в черный список номера мошенников, проводим сравнения с другими объявлениями в подобных домах и др.

В заключение

При решении этой задачи мы также выясняем, какиехарактеристики квартир наиболее весомые в определении цены (конкретно за квадратный метр Москве). Вы будете “удивлены”, но это близость метро и тип дома. А самым незначительный из общих параметров квартиры - количество комнат - этот фактор точно не влияет на стоимость квадратного метра.


РиэлтПред позволяет понять, по каким параметрам продавцы склонны завышать или занижать стоимость недвижимости. Анализ данных даст представление о поведении клиентов и продавцов и окажет большое влияние на отрасль. Также есть преимущества в виде специализированных услуг оперативного принятия решений.


Есть вопросы или предложения - пишите нам!

И не забудьте подписаться на рассылку - никакого спама, только новые кейсы и статьи об информационных технологиях в бизнесе.

Понравилось? Подпишись на обновления!

Мы страемся публиковать в данном разделе только полезный и уникальный контент для рынка. По этому подпишись и ты будешь первым, кто получит уведомление о свежей публикации
Нам будет приятно, если вы захотите подписаться на обновления наших проектов
Вы успешно подписались на уведомление об обновлениях.
Пожалуйста, укажите своё имя:
Нам очень приятно, что вы проявили интерес!