京公网安备 11010802034615号
经营许可证编号:京B2-20210330
一句话,认识到大数据时代的到来
1,什么是大数据
大数据,是大数据文件,还是大量的数据文件?要多大,KB,MB,GB,TB,PB,EB?还是说是大范围的数据,包括文本,图像,视频。。。
至少到2014年,大数据还没有一个准确的范畴定义。这是IEEE关于大数据的特别报告集里的说法。这里的问题就在于,一个大字,每天都在变:更多的设备被应用到日常生活,每天都有超越以往所有的比特在网络产生,流动,湮灭,同样,每天都有更多的超越以往的对这些比特流的使用,应用在发生,而这样的使用,应用,又进一步产生更大量的数据流。

那么,就是大数据是什么?
2,大数据是各种 IT 技术发展的汇聚点
2.1,光纤通信,DSL接入,Wifi,LTE,等等等等的通信连接转换设备,越来越多的带宽,越来越低廉的价格,使得网络大数据传输成为可能。
2.2,光学技术与半导体集成电路技术使得大规模的数据存储成为可能。
2.3,各种 sensor 技术使得数据的日常获取越来越便捷。
2.4,数据库技术的长时间发展与广泛应用提供了足够的,初始的结构化数据的来源,并提供了新数据处理方式的原始脉络。
2.5,人工智能技术,包括图像视频文本的理解分析,原始数据的结构化挖掘,自然语言处理,机器学习等等等,使得从已有数据中获得新的惊喜知识成为每天都在发生的事情。
2.6,摩尔定律使得数据处理的成本越来越低廉,但是效率却越来越高。
2.7,移动通信技术使得每个人每个时刻在每个地方都在为数据的越来越大做出贡献。
2.8,网络信息检索技术,使得数据/知识的应用与分布越来越扁平化。
2.9,基于上述各项技术的发展,越来越多的应用领域得到了新的推动助力。。。
3,我们能够从大数据中得到什么?
2007年一月11日,Jim Gray,微软的资深科学家,在给美国国家研究委员会的报告中,提出了一种新的科学研究范式:密集数据里的科学发现。这是自观察,实验,计算机模拟后的又一种科学研究范式。
换句话说,人类有了一种新的知识获取的方式。而这个方式是自生产的:数据,数据中获得知识,知识本身就是数据,从数据中再获得知识,。。。以此递进,这是一种自生产,自组织的,自我成长的,知识体系。
3.1,举例而言,你问过自己下面三个问题吗?
你喜欢恐怖片么?你曾经独自去外国旅行过么?觉得去驾驶帆船好玩么?
好吧,告诉你为什么你可以问问自己这么三个问题。这是美国一个社交网站总结出来的,如果你想找能够相守一生的伴侣的话,这三个问题的答案可以作为参考。(我觉得在中国可能不靠谱)。
3.2,那么来一个靠谱一点的吧:你和女友/老婆经常吵架为了什么?钱么?缺钱么?。。。。
大数据分析结果是:不是因为缺钱,而是因为你们俩对如何花钱不一致(这不是废话么)。
4,大数据下的挑战
首先是数据安全。谁能使用,谁应该拥有,谁能够维护我们的数据,并保证这样的数据应用不会给我们带来安全上的问题?
然后是个人的隐私,你懂的
而且人工智能还不那么靠谱吧。。。连我的 l n 不分都分辨不出来
难道我们就能够依赖冷冰冰的机器,网络,和数据吗?还要人干吗?
5,毋庸置疑,大数据时代已经来到了。你我都在其中。
互联网上每秒钟都在不停地刷新上传下载流通各种数据。你知道你不是用并不意味着你不在其中。
互联网上每秒钟都在产生海量的信息流动以满足各种应用的需求,而这些海量的信息流动就是知识的流动与生产,并进一步产生数据,知识,这已经就是一种新的智能的存在。
大数据意味着统计,预测,结构化的信息随时随地都在发生,产生,应用,这是我们人类新的智能体系。
新的时代已经来了。
6,你我如何做?
投身于IT吗?去做大数据吗?
No。因为在挨踢的想挨踢得人太多了,不缺一个你,也不缺一个我。
干自己的活,让大数据为你我而服务,用大数据提升你我,用大数据改善自己的生活,推动自己的事业,仅此就足够你我忙不过来了。
一句话,认识到大数据时代的到来,站稳自己的领域,将两者结合起来,就是你我在大数据下的选择。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】软件、洞察力、大数据、产品、经验、硬件、流量、创新、决策、数据安全、网络安全、数据分析、决策制定、数据挖 ...
2026-06-18在方案选型、效果复盘、产品评估、供应商筛选等各类业务决策场景中,仅凭单一指标下结论往往会陷入 “以偏概全” 的误区。多维度 ...
2026-06-18 很多数据分析师精通Excel单元格操作,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质区别”“为什么表结 ...
2026-06-18在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-06-17【核心关键词】数据库、电商、知识、产品、数据产品、监管业务、产品经理、业务系统、用户行为分析、用户分析、数据分析、电商 ...
2026-06-16在 Python 动态类型与面向对象的编程体系中,变量定义与类实例化是构建代码逻辑的两大核心基石。变量是数据存储、传递与运算的基 ...
2026-06-16 很多数据分析师每天与Excel打交道,但当被问到“表格结构数据和表结构数据有什么区别”“数据类型误判会引发哪些分析错误” ...
2026-06-16在 MySQL 查询性能优化体系中,索引是降低查询耗时、提升数据库吞吐的核心手段。其中联合索引与覆盖索引是实际开发中最高频的两 ...
2026-06-15在数据仓库建设与商业智能分析体系中,维度建模是应用最广泛的建模方法论,而事实表与维度表是维度建模的两大核心构件,共同构成 ...
2026-06-15 很多数据分析师能熟练计算指标,但当被问到“这家企业的核心业务目标是什么”“如何把模糊的战略目标拆解为可量化的指标”“ ...
2026-06-15在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10