京公网安备 11010802034615号
经营许可证编号:京B2-20210330
地产大数据时代终于来了,数据治理和应用是关键
地产行业正在发生悄悄的革命,以前开发商主要考虑卖好房子就可以了,然而在市场竞争愈加激烈后,如何经营与维护老业主,并从存量市场提取信息指导业务,成为许多企业的探索目标。因此企业在积累了大量用户后,如何更好服务现有客户,成为需要解决的问题。
需求之外,真正地实施并不容易
纵观地产行业,目前碰到挑战可能不是技术上的,而在于数据治理与应用上。
首先,数据挑战来源于行业数据隐私观念方面。地产还属于一个很传统的行业,有时候一个客户甚至能带来数百万的价值,因此对数据看的非常重要。他们对客户隐私的保护比任何行业都要强,很多人还盲目相信自建机房,他们还不接受云服务更安全的实事。
其次,数据的缺、散、乱现象非常明显,数据采集、融合难度较大。计算方面的问题都可以通过数加解决,面临的最大挑战反而在于数据的不规整。
地产是个很传统的行业,以前数据以纸质和笔质的居多,比如看房时的来访登记,因此首先需要解决的问题是如何将纸质数据搬到云端数据库上,其次才能挖掘和分析;而且,在已有IT系统中,就是数据缺散乱的现象,比如物业有物业的系统、停车有停车的系统,现在地产也不只是地产,甚至有酒店和商场,所有数据都放在各种不同的地方。
为什么使用阿里云数加?
明源成立近20年,在前十六七年 在传统ERP软件轨道上跑,3年前世界变了,云计算&移动互联网来了,如果不作出变化极有可能被颠覆。明源决定开辟新的战场,而在这个时候,新业务不应该用传统的方式来做,更应该用互联网的方式来做。
理念上,未来大数据的能力与云计算本身应该一样,都是一种服务。就像明源经常给用户举的例子,10年前,IBM有台电脑叫深蓝,那个时候所有计算机都是有个箱子的,但是现在再去看阿法狗或者ET,箱子已经不见了。时下,计算机已经变成了计算能力,那么为什么还要再去搭那个箱子?!对比拥有,资源共享显然更加合适。因此,我们现在向用户提供的软件产品里面,也更希望推公有云,推SaaS,我们向用户传导的就是用比拥有更重要,这是最根本的理念变化。
本质上,大数据可归结为计算能力、算法能力及海量的外部数据资源:
第一,海量数据不可能来自一家,也不可能只存在明源的机房里;
第二,海量计算能力,明源肯定也无法独立完成,这肯定是在云计算平台上;
第三,算法能力,这个肯定是优秀的算法专家构建的,这和安全有点类似,这个肯定在行业的龙头。
计算+算法+数据能力是在云上做迭代的,如果用静止的观念看,如果停滞不前,那么可以自己干,因此只能选择在平台上。
明源在4年前已全部转向云计算,属于数加的第一批客户,因此也不推荐基于地产创业的企业再去自建大数据平台。
在技术考量之初,明源云注意到一些开发商在千万级别的服务器投资后,得到的回报却很低,集群建立后产生价值难以达到预期。在参考这些案例后,明源从开始就使用了阿里云数加云服务。对比保险行业的大数据,3000万用户的聚类分析,花了半年的时间去实施。但是类似应用场景在建立地产用户分群时,使用了阿里云数据开发之后, 结果3天就跑完了,因此数加有个巨大的赋能意义在里面。
数加的机器学习模块在云采购进行探索试用,比如做供需双方对接,精准预测优质供应商升级服务的意愿,这样运营人员可能就直接的一对一电话出去,进行一个精准的服务,大量类似于这样的一个场景。此外,明源云还用到了DataV,比如在之前地产公司的一个项目,比如所有从ERP中导出的数据,通过DataV的形式做用户的作战大屏,了解每个区域的用户增长情况,从而针对性的做营销。
解决方案及架构
“阿里云数加的覆盖面很广,从存储、计算到上层应用,提供了一整套的解决方案,确实起到了马总说的普惠大数据。此外,数加也在不断的迭代,不停的有新产品出现,我们也再不断尝试。因此,紧跟阿里云的发布,贴合自己的业务,肯定会有不断的新价值产生。”明源云大数据项目负责人刘峥说道。目前,明源使用的阿里云数加产品及组件有:
大数据开发套件(DataIDE)
大数据计算服务(MaxCompute,原名ODPS)
DataV数据可视化
机器学习(PAI)
目前,明源云在营销和云采购方面采用了阿里云数加解决方案,接下来还会在金融方面深入应用。在营销应用方面,通过云业务和ERP数据源,直接做数据采集进入数加MaxCompute(原名ODPS),然后再对数据做清洗和转化,将处理结果保存到RDS中,最后用DataV连RDS做数据大屏。
在云采购方面,首先通过数据同步的操作,把日志数据从RDS中同步到MaxCompute的表存储中;然后,利用机器学习PAI对于数据进行特征工程处理并且进入逻辑回归算法进行模型训练;最后,在生成离线预测模型之后,使用大数据开发套件DataIDE进行离线预测调度,每天凌晨对于数据进行预测,按照用户的付费意向排序,选择付费意向高的对象作为潜在客户推送给销售人员。解决方案包括三个步骤:数据同步、机器学习、调度预测。
阿里云数加助力地产数据治理更高效
1、阿里云数加为明源云赋能,最大的降低了大数据的应用门槛。走到今天发现并不需要太专业的人才,普通的技术人员也可以通过数加玩转大数据,各种数加产品的技术门槛都是很低的,能很快上手。
2、明源云一方面通过阿里云数加来搭建数据管理平台,帮助企业来治理数据的缺、散、乱;另一方面,明源更结合地产行业实际情况,在大数据行业上展开众多摸索:
首先,在拿地上,可以结合第三方数据,把土地周边的配套设施发展,比如人口、公园等数据展示出来,给房地产公司提供参考;
其次,在营销上,可以在客户到访以后做客户地图,也可以通过数据分析用户购房的真正需求,是改善亦或是刚需;
最后,在运营上,可以通过数据做产品的改进,比如客户住了房子后,发现楼间距较窄、绿化面积太少或者是不科学、灯光不够亮等等。刘峥指出,现在许多开发商中,60%都是老业主,这是一个很庞大的数字,如何经营他们成为重中之重。
3、明源和阿里云一起联合举办地产行业CIO峰会,展开越来越多的布道,引导客户数据上云。
对于大数据,明源云副总裁童继龙表示:“过去有PC时代的B/S架构技术,移动互联网领域的开发技术,大数据也可能成为一个时代,在地产行业,从拿地、设计、开发、建造、质量管理、营销、服务、每一个价值链上都有大数据的场景,因此有着很大的空间,至于每个部分可以做到哪些,比如云采购帮助采购匹配更好的供应商,云客帮助地产公司找到客户群,完成广告投放;过去的投放是漏斗形的,倒金字塔,投10万个可能来1000个;但是大数据时代可能是正金字塔,知道客户在哪,投进去,通过结果指导下次投放,越投越准。在地产行业,明源已经在不同的产品线,通过大数据去指导客户去做业务,也期待更多的人参与进来。”
另外,也从技术角度逐步引导客户数据上云,刘峥表示:“现在我们的解决方案:通过Docker的模式,他们自己租用阿里云,通过公有云的私有部署来打消对数据隐私的顾虑。总的来说,虽然这方面比较敏感,但是仍有突破。”
总结
阿里云与明源云,双方在业务的融合度上越来越高。阿里云云计算与大数据产品本身迭代的很快,而明源在地产行业数据与计算的应用上迭代也很快。明源不止是用阿里云的服务,还在向自己客户提供服务的过程中,同时使用了阿里云其他生态伙伴的产品,比如通讯解决方案提供商云之讯等。对于明源来说,用最快的速度,最成熟的服务为客户提供服务才是关键;因此,明源选择阿里云,不是选择了单单一个阿里云,更选择了阿里云整个生态,与这个生态共同成长。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22