京公网安备 11010802034615号
经营许可证编号:京B2-20210330
英特尔公司的创始人之一戈登•摩尔在1965年发现了一个惊人的趋势,即集成电路芯片上所集成的电路的数目每隔18个月就翻一番,该发现被业界誉为摩尔定律。后来也有被描述为微处理器的性能每隔18个月提高一倍,或价格下降一半;或用同等价钱能买到的电脑性能(速度和储存量)每隔18个月翻一番,等等。
40多年在人类沧海桑田的历史上仅仅是弹指一挥间,摩尔定律却见证了电脑的数据处理和储存能力从K(Kilobyte)到M(Megabyte)到G(Gigabyte)到T(Terabyte)的变迁。尤其是互联网的出现,让我们急速地跨入了大数据(Big Data)时代。其主要的驱动力有以下几点:
1、随着社会经济的发展和个人收入的增加,人们的个性化需求开始凸显。而企业要去高效地满足这些个性化的需求则需要大量的数据支持。
2、互联网的出现和相关技术的发展让海量数据的收集和分析成为可能。互联网的特征又导致这些数据能够被高速度和大容量的传播。
3、互联网引入了由用户产生数据的模式。这种模式的特征是多源头,低成本,更及时。当然,这些数据的真实性和可靠性需要被核证。
4、构建在互联网基础上的电子商务和传统零售比较的优势之一就是数据的可获得性。电子商务可以实时得到顾客的来访源头,在网站内的搜索、收藏、购买行为,以及购买的商品间的关联性。这些数据可以帮助企业更精准的为顾客服务。
5、人工智能、信息系统和决策科学的发展促进了多种分析方法及工具的推动,包括数据挖掘,顾客行为模型,决策支持,等等。
数据(Data)是原始和零散的,经过过滤和组织后成为信息(Information),将相关联的信息整合和有效的呈现则成为知识(Knowledge),对知识的深层领悟而升华到理解事物的本质并可以举一反三则为智慧(Wisdom)。所以数据是源头,是决策和价值创造的基石。
数据的应用大致分以下几个步骤:a.数据采集、核实与过滤;b.在数据仓库内的分类和储存;c.数据挖掘以找到数据所隐含的规律和数据间的关联;d.数据模型建立和参数调整;e.基于数据的应用开发和决策支持。下面用实例来说明。
1、美国医药网站WebMD根据怀孕的女性用户填写的受孕信息定期给用户寄EDM,提醒母亲在该时间点的注意事项,需要摄入的营养,产前的生理变化和要做好的思想准备,产后的恢复,宝宝的育养和健康,等等。
2、1号店利用对大数据的分析给顾客发送个性化EDM。若顾客曾经在1号店网站上查看过一个商品而没有购买,则有几种可能:a.缺货,b.价格不合适,c.不是想要的品牌或不是想要的商品,d.只是看看。 若在顾客查看时该商品缺货则到货时立即通知顾客;若当时有货而顾客没有买就很有可能是因为价格引起的,则在该商品降价促销时通知顾客;同时,在引入和该商品相类似或相关联的商品时温馨告知顾客。另外,通过挖掘顾客的周期性购买习惯,在临近顾客的购买周期时适时的提醒顾客。
3、淘宝在2012年推出了淘宝时光机。 该应用通过分析顾客自注册为用户以来的行为,用幽默生动的语言告知顾客淘宝的成长,和该用户相类似喜好的其他用户的统计行为,对该顾客经过分析后对其喜好的了解和对其行为的预测,等等。用生动的文稿和个性化的数据、拉近了和顾客的距离。
4、Google的Adsense对顾客的搜索过程和其对各网站的关注度进行数据挖掘。 并在其联盟内的网站追踪顾客的去向,在联盟网站上推出和顾客潜在兴趣相匹配的广告,精准化营销,提高转化率。
5、Amazon近几年推出了FDFC(Forward Deployed Fulfillment Center)的概念,以加快对顾客配送的速度。Amazon的订单履行中心分两个层级:FC和FDFC,其中FC品种更齐全,而FDFC在物理位置上更靠近目标市场,但品种重点容纳针对目标市场的热销商品,顾客的大部分需求可以通过FDFC来满足,不能满足的长尾商品则由FC来满足。这样顾客急需的商品多数可以通过FDFC以更快捷和低成本的物流来完成。由于热销商品是随着时间和季节而改变的,故将什么商品储存在FDFC的决策是动态调整的,而此决策的依据就是对顾客需求的分析和预测。
各种应用的例子难以穷举,但趋势十分清楚:大数据的应用价值和潜力不再被人低估。但并不是所有企业都能在大数据这个金矿里真正挖到金子的。只有那些有远见有视野,重视系统,舍得投入,吸引了优秀的分析和系统人才的企业才会有所斩获。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15在企业数字化转型、系统架构设计、数据治理与AI落地过程中,数据模型、本体模型、业务模型是三大核心基础模型,三者相互支撑、各 ...
2026-04-15数据分析师的一天,80%的时间花在表格数据上,但80%的坑也踩在表格数据上。 如果你分不清数值型和文本型的区别,不知道数据从哪 ...
2026-04-15在人工智能与机器学习落地过程中,模型质量直接决定了应用效果的优劣——无论是分类、回归、生成式模型,还是推荐、预测类模型, ...
2026-04-14在Python网络编程、接口测试、爬虫开发等场景中,HTTP请求的发送与响应处理是核心需求。Requests库作为Python生态中最流行的HTTP ...
2026-04-14 很多新人学完Python、SQL,拿到一张Excel表还是不知从何下手。 其实,90%的商业分析问题,都藏在表格的结构里。 ” 引言:为 ...
2026-04-14在回归分析中,因子(即自变量)的筛选是构建高效、可靠回归模型的核心步骤——实际分析场景中,往往存在多个候选因子,其中部分 ...
2026-04-13在机器学习模型开发过程中,过拟合是制约模型泛化能力的核心痛点——模型过度学习训练数据中的噪声与偶然细节,导致在训练集上表 ...
2026-04-13在数据驱动商业升级的今天,商业数据分析已成为企业精细化运营、科学决策的核心手段,而一套规范、高效的商业数据分析总体流程, ...
2026-04-13主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破 ...
2026-04-13在数据可视化与业务分析中,同比分析是衡量业务发展趋势、识别周期波动的核心手段,其核心逻辑是将当前周期数据与上年同期数据进 ...
2026-04-13在机器学习模型的落地应用中,预测精度并非衡量模型可靠性的唯一标准,不确定性分析同样不可或缺。尤其是在医疗诊断、自动驾驶、 ...
2026-04-10数据本身是沉默的,唯有通过有效的呈现方式,才能让其背后的规律、趋势与价值被看见、被理解、被运用。统计制图(数据可视化)作 ...
2026-04-10在全球化深度发展的今天,跨文化传播已成为连接不同文明、促进多元共生的核心纽带,其研究核心围绕“信息传递、文化解读、意义建 ...
2026-04-09在数据可视化领域,折线图是展示时序数据、趋势变化的核心图表类型之一,其简洁的线条的能够清晰呈现数据的起伏规律。Python ECh ...
2026-04-09在数据驱动的时代,数据分析早已不是“凭经验、靠感觉”的零散操作,而是一套具备固定逻辑、标准化流程的系统方法——这就是数据 ...
2026-04-09长短期记忆网络(LSTM)作为循环神经网络(RNN)的重要改进模型,凭借其独特的门控机制(遗忘门、输入门、输出门),有效解决了 ...
2026-04-08在数据分析全流程中,数据质量是决定分析结论可靠性的核心前提,而异常值作为数据集中的“异类”,往往会干扰统计检验、模型训练 ...
2026-04-08在数字经济飞速发展的今天,数据已渗透到各行各业的核心场景,成为解读趋势、优化决策、创造价值的核心载体。而数据分析,作为挖 ...
2026-04-08在数据分析全流程中,数据处理是基础,图形可视化是核心呈现手段——前者负责将杂乱无章的原始数据转化为干净、规范、可分析的格 ...
2026-04-07