掌握房地产大数据,可以做什么?

理由
举报 取消

因为一些原因,掌握了北上广深的每月房地产交易数据,以北京和上海的交易数据最为详细完整。可以落实到每个版块,每家每户成交数据是多少,涨跌幅度,便宜还是贵了,哪个小区升值空间最大,什么房型最受欢迎等等,数据很全面。并且这些数据可以实时更新。所以我就想,能不能利用这些数据做些什么,把数据变成价值,一直在琢磨这个问题,还请知乎各路大神都说说自己的看法,谢谢大家!

2017年8月30日 6 条回复 963 次浏览

发起人:Yeti Lee 初入职场

亚细亚的孤儿

回复 ( 6 )

  1. Rorschach
    理由
    举报 取消

    你这个数据如果能精确到每家每户的话,那就相当于美国的 MLS 数据。

    在 MLS 基础上,美国人搞出来了 Redfin,Zillow 这样的房地产数据服务公司。 目前加起来市值100亿美元总是有的。

    但是如果你只是 aggregate 到一起的比如『哪个小区卖了多少』这种的,那没啥意思。

  2. 芦荟保湿
    理由
    举报 取消

    这个东西,很多年前就有了。很简单的市场成交数据,区域、项目的供应量、成交量,每种户型的成交量、年走势。等等。

    根本算不上大数据。

    连大数据的边都贴不上的。

    比如,某小区。住户都在哪个区域里上班?住户的收入情况?住户日常消费习惯?这才是大数据。

  3. 德仔
    理由
    举报 取消

    上海万科:如何用先进'大数据'手段研究市场?

    更清晰全面的了解城市每一块土地的真实情况及价值潜能

    更细致客观的分析市场走向 追踪一二手房真实成交情况

    更深层直观的洞察人群通勤方向、潜在需求及购买行为

    先进方法据了解,此次万科大数据平台整合了多家先进的数据源,通过建立先进的分析模型,对已知客观事实用先进的分析维度进行验证,同时对未知的市场及客群进行分析研究。
    哪些先进的数据源数据资源参与此次万科大数据平台搭建的优质数据资源方多为各行业领先企业,提供除了传统市场数据外更多维度的:城市级大数据 ——包括人口、经济、交通、基础设施等;人口移动数据 ——包括全市地铁通勤、专车及出租车通勤等;通过线上线下实时监测所获得的活跃购房客户特征数据 ——包括人口消费习惯 、人口行为特征等。

    数据来源及资源广泛
    哪些先进的分析模型?据介绍,万科此次搭建大数据平台的初衷,就是希望能够颠覆传统开发商所采用的分析方式与路径,通过运用先进的分析模型,对大量复杂抽象的数据进行整合分析,从而反映本质事实,揭示内部规律,辅助各项决策。
    核密度分析在进行如人口密度、基础设施密度、客流密度来源等要素密度进行分析时,万科大数据平台采用了核密度分析模型。该模型通过采集待分析标的要素的信息,设置分析半径范围,通过算法计算要素在其周围邻域中的密度。

    模型分析示例:上海九大商圈客流来源
    空间插值分析在对某要素分布空间范围进行分析及预测时,万科大数据平台采用了空间插值模型。研发人员首先假设空间位置上接近的对象具有相似的特征,于是通过自然邻域插值法,找到距查询点最近的输入样本子集,并基于区域大小按比例对这些样本应用权重进行插值,进而对区域所有位置进行预测。

    插值点及邻域权重模型示意图

    模型分析实例:上海成交新房按单价及总价的不同空间分布
    OD/PA分析模型在分析如城市或区域人口通勤方向及发展趋势时,则采用了OD/PA分析模型。该模型以千万级的智能移动设备大数据为基础,对全市人口出行进行拟合计算,可以了解要素流动情况。

    OD/PA模型示意图

    模型分析实例:市民出行OD图(左)、现居地与搜索房屋距离PA图(右)
    力导向布局分析模型在研究要素关系网络、城市群相互联系时,万科大数据平台的研发人员采用力导向布局分析模型。该模型将每个要素表现为一个点,要素间的联系表现为边,通过计算各要素间的关联度,绘制出拓扑关系网络图,表现要素间的聚集度和紧密度。

    力导向布局模型示意图(左);模型分析实例(右):长三角城市群联系度力导向布局图
    交通断面流量分析模型通过对轨道交通站点客流出行方向和数量的分析,从而对断面客流量进行评估和趋势判断。

    交通断面流量模型分析实例:早高峰地铁客流量
    空间计量模型城市存在空间聚集效应,要素将受到本空间单元和临近空间单元的共同影响。因此在对某特定研究对象进行要素影响分析时,平台研发人员运用空间计量模型使结果趋于客观精确。

    空间计量模型分析实例:房价增幅影响要素分析
    板块价值分析模型在进行目标板块价值评估模块设计时,研发人员将万科传统的PIE模型与板块评价体系所涉及的多维度数据进行基于计量经济学模型的系统化整合,将他们分为6个大类和19项重点指标,构建板块价值计量模型。并以此为基础,通过数据预处理、回归及相关性分析后,对被解释变量进行评估及预测。

    板块价值模型示意哪些先进的研究维度?

    多维数据交叉验证数据源往往存在缺陷,如对人群的抽样存在偏差、年代不够新、数据维度较少等。因此,万科认为,需使用不同数据源对同一个问题进行研究,以此能够相互印证的结论才更具说服力。如通过多维比较常住人口数据、新房销量地均密度数据和人口通勤数据,分析近十余年来上海人口转移方向。

    多维印证人口外迁
    自定义空间分析单元传统分析方法往往以板块和地块作为分析单元,但在日常工作中,待分析对象则需要根据研究目的进行调整。因此万科大数据平台创建了自定义分析单元,以此拓展分析方向,发散思维,提高决策判断的准确性。如对商业物业的选址进行决策时,会将现有商圈的势力范围作为分析单元进行研究。

    以大型商圈为研究对象的势力范围研究
    如对地铁上盖物业产品类型进行选择决策时,会对各地铁站早高峰客流进出占比进行研究,了解地铁站产业或居住属性特征。

    进出比<0.8为产业区型地铁站
    进出比>1.2为居住区型地铁站▲
    以个体为单位的研究尺度在对特定人群进行更细化的研究时,传统路径是采用客户调研的方法,但样本基数及回答真实性都会影响研究结果。万科大数据平台则可以根据用户的线上线下行为,利用机器学习算法,对其个人属性、职住地点、兴趣爱好等进行判断,进行多角度画像。

    在沪购房者各省来源情况

    一套房及二套房购房偏好分布
    客户导向只有了解客户、接近客户,才能提供让客户满意的产品与服务。值得一提的是,万科此次将智能设备采集的数据与优质合作方提供的资源进行整合,以大数据机器学习算法对全市范围内的典型活跃客户及项目到访客户数据进行深加工,对细分市场上不同消费群体的特征及分布进行了解与研究。

    潜客职住热力图
    此外对采集到的原始标签数据进行补全计算或赋予布尔值、类型值。再加入房地产行业客户分析逻辑,在家庭结构、置业需求、购房能力、还贷能力方面,将原始标签合并成新的标签进行计算,最后得到客户的多维度画像、存储和输出。

    客户画像输出流程图
    正因为有了清晰的客户画像,万科才能更好的进行产品及项目的设计定位,进而为客户提供满足他们真正需求的更好的产品与服务。

    客户特征图
    分析案例上海万科大数据研究案例据上海万科负责市场研究的工作人员介绍,目前公司在拿地前都会借助该大数据平台,综合运用各类分析模型,多维度建立从宏观到微观的分析体系,对标的地块所具有的特征及变化趋势进行研究,进而支持初步判断。
    万科研究示例 :上海某新城板块土地一个具有成长型、潜力型人口特征的板块

    研究版块人口学历及年龄结构
    一个现代制造业和公共服务业双头并重的板块

    研究版块就业行业人数及企业分布
    一个职住关系处于高度分离的板块

    研究版块人口职住情况
    一个就业活力越来越高的板块

    研究版块主要地铁站工作日早高峰客流量差值
    一个承接大量外区导入就业人口的板块

    研究版块职住通勤分布
    根据对该板块人口、产业、经济等数据的分析,万科研究团队可以得出对板块的一个初步判断:该板块人口年龄轻、活力强,岗位供给上不仅有大量的产业工作,也有高端的公共服务和第三产业。更重要的是,其人口的聚集速度较岗位的聚集速度更快,整个地区正在高速发展中转型。有了初步判断后,研究团队可继续通过『板块价值类比』『未来发展潜能』及『潜在置业人口描摹』等分析模型,进一步辅助投资决策及产品定位。
    结语上海,在发展万科,在发展

    上海及全球主要城市多维排名情况

  4. 牛牛爸的乱弹
    理由
    举报 取消

    对很多品牌做地理大数据分析很有帮助。例如可以根据房价作出城市房价热力图,在豪华楼盘附近,一些豪华车可以考虑在那附近开高端展厅。对于中产的地段,餐厅等等是很好的选择。

  5. 王和五
    理由
    举报 取消

    你下了谁的裤子?

  6. 史克威尔
    理由
    举报 取消

    克而瑞有的是,想要可以拿钱买

    都在做数据分析,但是更有用的应该是行为数据

我来回答

Captcha 点击图片更换验证码