京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代下是数据思维重要,还是相应技术重要
技术做到一定程度,逐步发现自己的瓶颈。不由得开始思考这一方面的问题!到底大数据时代下,是相应的数据分析技术重要,还是相应数据思维重要?
先来说数据思维吧!什么是大数据思维,个人感觉应该是互联网思维的一种。是考虑到全面,而不是局部。是考虑到多维,而不是单一维度。不是靠拍脑门做决定,而是让数据说话,用数据做决策。
先说第一点,考虑全面,而不是局部。众所周知,移动互联网催生了大数据的产生。每一个人每一天通过手机能够的数据总和会是一个巨大的量。而通过这些非结构化的数据,我们首先面对的是如何处理这些数据,这里就涉及到数据的存储,读取的问题。由于数据的非结构化。传统的处理技术将不能够很好的起到作用。不是我们单一抽取几个用户的数据加以统计就可以预测出大量用户的行为。这里需要的全局的数据。首先,这一点是大数据相对于其他技术的第一点不同。
再来说第二点,考虑多维,而不是单一维度。大家都有目共睹,现在的广告已经开始基于我们的浏览时长而进行二次推荐。而在进行多维分析后,将不再只关注用户的浏览数据,而相应的会有用户的文本信息,好友评论,已购买产品信息,用卡频次.....当将用户数据进行多个维度的整合分析后,就可以做到精准营销。从而打破传统一维营销的被动宣传不叫好的特点。
最后再看第三点,让数据说话,用数据做决策。在这里不得不提一个软件R,传统行业的业务统计大部分是靠它完成,但他的数据呈现有一点的局限。当我们将一些数据以图表的形式展现在领导面前时,我们就可以根据这些数据做新一年的年度规划。而不至于拍脑门做决定。而且现在数据可视化的应用也是非常的多,现实的应用也展现了相应的价值。
说完了上面三点,再来说一说大数据技术。
首先必提的是Hadoop,这样一个分布式的存储现在已经在大部分企业应用,而它的分布式存储又将用户的读取时间缩短。而下一代技术Spark,也就相当于从Hadoop的硬盘存放,转而到了内存存放。众所周知,内存的读取速度会比硬盘快许多倍。
其次再要说的就是SAS与R,这两个软件都有各自的优势,SAS做为专业数据统计的软件,可以说在大数据量时处理起来有显著的优点。但在超过1T数据量的情况下,它的优势就不再那么明显。而R软件在绘图上有很大的优势,在数据可视化上有很重要的地位。但无奈,R软件在统计上略逊色SAS一筹。而与SAS的同类软件中,SPSS个人感觉在数据量小时会有很大的用途。
还有就是数据获取,RCurl与相应的爬虫技术,而在大数据时期,各网站在反爬虫方面势必会做要应的措施从而保护自身已有的数据。
还有就是ETL,这一点,个人感觉以后会在大数据落在时起到非常重要的地位。因为国内的数据大部分都需要清洗,就像我导师说过的一句话,在中国做大数据,最大的困难就是如何识别出假数据。用真实的数据才能分析出我们所要得到的结果。
好了,到此为止,以上就是自己学习到的大数据知识,分别在思维跟技术方面的认识。但问题又回来了,对于企业来讲,盈利是最基本的选择,到底是选一个具备大数据思维的人还是一个会很多大数据技术的人?而对于自己来说,下一步的方向是继续学习技术,还是掌握相应的思维。
思维OR技术,或左或右?或都两都需要融合,但话题又回来了,工作是很现实的问题,售前,咨询,研发,架构,实施,工程.......到底该如何选择,抑或就不要选择,先静下心来学习,等到在职的学习毕业后再去选择工作。
面对转行,从通信培训行业向互联网行业大数据的转变,虽然不知前方道路如何,仍有些迷茫,但既然选择前方,便只顾风雨兼程,加油!
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10 很多数据分析师每天都在计算指标、制作报表,但当被问到“什么叫指标数据元”“指标数据标准包含哪些核心维度”“指标数据质 ...
2026-06-10在MySQL数据库日常查询、数据统计、后台接口开发、数据导出等场景中,开发者经常需要查询数据表除某几列之外的所有字段。例如查 ...
2026-06-09在Python网络请求、爬虫开发、接口测试、数据抓取等实操场景中,requests库是最常用的第三方请求工具,而content属性是requests ...
2026-06-09 数据分析正在重塑每一个行业。CDA认证的三本官方教材,分别对应Level I、Level II、Level III,为你铺就从业务数据分析到数 ...
2026-06-09在数字财务、智慧财税、业财融合深度推进的当下,传统财务模式下数据标准混乱、业务流程碎片化、知识无法沉淀、系统互通性差等问 ...
2026-06-08随着数字经济深度渗透各行各业,数据正式成为继土地、劳动力、资本、技术之后的第五大生产要素,是企业数字化转型、精细化运营、 ...
2026-06-08 很多数据分析师能熟练写SQL、做透视表,但当被问到“数据是从哪里来的?经过哪些加工才进入数据仓库?ETL具体做了什么?”时 ...
2026-06-08【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04