惠新宸谈链家大数据平台Real Data建设思路
极客时间编辑部
讲述:丁婵大小:1.47M时长:03:13
近日,链家研究院发布了地产大数据产品 Real Data。Real Data 是一个针对 B 端用户所开发的房地产领域一站式研究和数据服务平台。InfoQ 记者采访了链家集团技术副总裁,同时也是此次 Real Data 研发团队的负责人惠新宸,他介绍了 Real Data 背后的核心技术和研发团队,以及数据赋能行业的一些思考。
Real Data 囊括城市基础数据库、市场数据库、用户行为数据库和集中式公寓字典四大数据库,支持多维交叉分析,形成用户画像,帮助开发商等客户定位潜客来源、预估客户交易行为以及挖掘客户需求偏好,如预估用户中意的房屋类型等。
通常来说,房产大数据有两大核心指标:一是数据颗粒度,颗粒度越细,大数据的价值越高;二是数据更新能力,数据更新能力越强,数据就会越真实越贴近市场。
Real Data 正是在这样的要求下诞生的,它具有数据精细、真实,并且实时更新的特点。
首先是它的数据颗粒度,Real Data 采用商圈层级数据统计方式,依据地理维度进行聚合,形成聚合后的区域热点,按照成交量、人流量及热度的不同,进行商圈层级的划分,相较于行政区域划分统计,数据颗粒度更细。未来 Real Data 还将细化到小区级别的数据统计,对小区楼栋,业态、户型、总价和面积段提供数据交叉分析。
数据的真实性方面,首先,从渠道信息采集上来看,线上链家网、链家 App 已经累计 3000 万注册用户量,日活跃用户达 300 万,线下拥有全国 8000 家门店,15 万经纪人,可以实时采集成交数据。另一方面,链家的楼盘字典数据库囊括了全国 36 个重点核心城市的 8000 万房源数据,容量达到了 1200T,收录了包括房源房间门牌号、标准户型图、属性信息、配套设施信息、历史业务数据等多维度信息,它保障了房源的真实性。此外,链家采用数据筛选机制(元数据平台)、自动清洗机制(剔除虚假信息)等数据管理体系,以技术的形式保障数据真实可信。
谈到 Real Data 数据能实时更新的原因,惠新宸表示:“我们建设系统的思路是以数据为导向,围绕人、房、客三方建设系统,通过用户的数据以及在整个过程中实时产生的交互行为,来推动整个系统的建设。基于这一点,用户上一秒的交互,就会成为下一秒的推荐特征,这也保证了 Real Data 产品实时画像能力的实现。”同时,线上用户数据采集的不断完善,也使得链家的用户数据库趋于丰富,用户画像趋于精细化。
Real Data 的这些特点,使其为政府、房企、金融机构等房产全产业链参与者,提供精准数据服务和决策依据成为可能。
最后惠新宸表示,未来,Real Data 还将对已有的各项数据进行完善,扩充资产管理相关功能。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论