分享数据挖掘基本方法 数据分析师利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等, 它们分别从不同的角度对数据进行挖掘。 1.分类 ...
2014-07-09大数据面临问题 尽管计算性能、存储容量以及分析技术一直在不断进步,某些现实挑战对于数据分析师据而言仍然过于庞大以至于无法应对,在今天的文章中,我们将探讨几个此类难题 ——看看如何才能将其解决。 ...
2014-07-09今日之电商诸侯争霸,可谓火药味甚浓,更推进着产业前进步伐。古语有云:长袖善舞,多钱善贾,意指有所依靠,事情容易成功。随着大数据所爆发出的巨大潜力,在如今的互联网经济时代,玩电商的“有才 ...
2014-07-09注:在迅雷公司内部做了分享《大数据成为生产力》 ,150页的PPT,内容太多,讲的速度有些快。删减掉一些敏感信息,汇总主要观点浓缩成为此文,或许对大家构建企业的大数据运营体系有些参考作用。 ...
2014-07-08有人说,首席财务官(CFO)是企业发展到一定阶段的必然产物,没有财务管理就没有现代意义上完善的治理结构。这个观点在民营企业的发展中一次次被印证。 当一家企业从“野蛮生长”进入快速发 ...
2014-07-08日前中国公布今年首季GDP增长率为7.4%,不少分析都说数据较市场预期好。为什么?因为市场估增7.2%。而笔者看这个7.4%好不好,是从客观情况看,之前笔者不会去估GDP会增多少,因为没有意义。 ...
2014-07-08关于“大数据”概念的产生 1.“大数据”的名称来自于未来学家托夫勒所著的《第三次浪潮》 尽管“大数据”这个词直到最近才受到人们的高度关注,但早在1980年,著名未来学家托夫勒在其所著的《第三次浪潮 ...
2014-07-08余额宝诞生一年之后,火速蹿红成为中国第一大、全球第四大货币基金。扫描余额宝的粉丝特点,全中国的潮男女、穷屌丝、高富帅的分布一目了然;如果投资者看看自己的账单,一定会发现自己不为人知的一面。 ...
2014-07-08知道富人们为什么有钱而你却还在为买不起房而发愁吗?对此问题有数据分析师对此进行数据分析,数据分析师对此得出的结论是:因为他们有着和你不一样的思维模式。比如他们相信好的习惯会带来成功,相 信努力 ...
2014-07-08网络上铺天盖地的广告信息早就让人们应接不暇,先要流量再要变现最后求精准定位、高转化率,眼下互联网界正属于第三个求精准定位高转化率的阶段,于是“数据”就成了每个商户搜集的重点,更有甚者“无所不用其 ...
2014-07-08今年夏天,除了关注《变型金刚4》等好莱坞大片的票房表现,以及韩寒郭敬明的“瑜亮之争”,同时引人瞩目的还有传统暑期档中动画军团的市场表现。目前,已定档在这个暑期上映的动画电影已有十多部,数量创下历 ...
2014-07-08随着云计算、物联网的发展,我们迎来了大数据时代。为进一步推动国内大数据的研究与实践,促进大数据在金融、医疗、教育等各大行业中的广泛应用,搭建一个大数据行业内沟通与合作的高层次平台,由中 ...
2014-07-08Reddit有篇帖子介绍了算法对我们现在生活的重要性,以及哪些算法对现代文明所做贡献最大。如果对算法有所了解,读这篇文章时你可能会问“作者知道算法为何物吗?”,或是“Facebook的‘信息流’(News Feed)算是一种 ...
2014-07-07爱的动因源自于对美的追求,事实上,美学观点,或称对美的看法是随时间变化而不断变化的。最初,涉世不深的年轻人更注重容貌上的美,所谓的男孩要“帅” ,女孩要“靓” ,待他(她)慢慢成熟以后,观点会发生变 ...
2014-07-07要是刘姥姥来到21世纪,把每一座大都市都逛上几圈,她一定会觉得都市人最喜欢的娱乐就是排队。早在1946年,匈牙利裔的作家乔治·米克斯(George Mikes)定居伦敦时,就在著作《如何当一个外星人 》(How To Be An ...
2014-07-07先给大家看几条关于互联网的新闻,第一条是百度网页搜索份额达到73.2%,百度处理了1096亿条网页搜索请求,与去年相比提升了0.6个百分点。报告发布后,有出现了很多博客就根据这个数字来攻击Google,说它做的不好。来 ...
2014-07-07六月这个特殊的月,我们都会关注一些“时令”信息,比如高考,比如世界杯,比如就业……一说到这些,媒体上充斥的就是非常时髦的排名,什么大学排行榜,MBA商学院排名,专业排行榜,专业就业排行榜,最佳球员榜, ...
2014-07-07吸引用户来浏览你的网站本身就很困难,因为网络上存在着大量的站点。让用户在你的网站有足够的停留时间是网站运营的另外一个问题。保持你的网站对用户有吸引力是关键所在。只要你的网站具有吸引力,那么形象塑 ...
2014-07-05从“舌尖上的浪费”到“车轮上的铺张”,再到“墓地里的奢华”,人们看到,浪费之风侵蚀社会诸多领域,严重制约着资源效率的提升。而一些惊人的浪费就发生在日常生活中,发生在不经意的举手投足间,发生在我们身边 ...
2014-07-05软件正在统治世界。而软件的核心则是算法。算法千千万万,又有哪些算法属于“皇冠上的珍珠”呢?Marcos Otero 给出了他的看法。 什么是算法? 通俗而言,算法是一个定义明确的计算过程,可以一些值或一 ...
2014-07-05训练与验证损失骤升:机器学习训练中的异常诊断与解决方案 在机器学习模型训练过程中,“损失曲线” 是反映模型学习状态的核心指 ...
2025-09-19解析 DataHub 与 Kafka:数据生态中两类核心工具的差异与协同 在数字化转型加速的今天,企业对数据的需求已从 “存储” 转向 “ ...
2025-09-19CDA 数据分析师:让统计基本概念成为业务决策的底层逻辑 统计基本概念是商业数据分析的 “基础语言”—— 从描述数据分布的 “均 ...
2025-09-19CDA 数据分析师:表结构数据 “获取 - 加工 - 使用” 全流程的赋能者 表结构数据(如数据库表、Excel 表、CSV 文件)是企业数字 ...
2025-09-19SQL Server 中 CONVERT 函数的日期转换:从基础用法到实战优化 在 SQL Server 的数据处理中,日期格式转换是高频需求 —— 无论 ...
2025-09-18MySQL 大表拆分与关联查询效率:打破 “拆分必慢” 的认知误区 在 MySQL 数据库管理中,“大表” 始终是性能优化绕不开的话题。 ...
2025-09-18DSGE 模型中的 Et:理性预期算子的内涵、作用与应用解析 动态随机一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明确:TIF 中的地名有哪两种存在形式? 在开始提取前,需先判断 TIF 文件的类型 —— ...
2025-09-17CDA 数据分析师:解锁表结构数据特征价值的专业核心 表结构数据(以 “行 - 列” 规范存储的结构化数据,如数据库表、Excel 表、 ...
2025-09-17Excel 导入数据含缺失值?详解 dropna 函数的功能与实战应用 在用 Python(如 pandas 库)处理 Excel 数据时,“缺失值” 是高频 ...
2025-09-16深入解析卡方检验与 t 检验:差异、适用场景与实践应用 在数据分析与统计学领域,假设检验是验证研究假设、判断数据差异是否 “ ...
2025-09-16CDA 数据分析师:掌控表格结构数据全功能周期的专业操盘手 表格结构数据(以 “行 - 列” 存储的结构化数据,如 Excel 表、数据 ...
2025-09-16MySQL 执行计划中 rows 数量的准确性解析:原理、影响因素与优化 在 MySQL SQL 调优中,EXPLAIN执行计划是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 对象的 text 与 content:区别、场景与实践指南 在 Python 进行 HTTP 网络请求开发时(如使用requests ...
2025-09-15CDA 数据分析师:激活表格结构数据价值的核心操盘手 表格结构数据(如 Excel 表格、数据库表)是企业最基础、最核心的数据形态 ...
2025-09-15Python HTTP 请求工具对比:urllib.request 与 requests 的核心差异与选择指南 在 Python 处理 HTTP 请求(如接口调用、数据爬取 ...
2025-09-12解决 pd.read_csv 读取长浮点数据的科学计数法问题 为帮助 Python 数据从业者解决pd.read_csv读取长浮点数据时的科学计数法问题 ...
2025-09-12CDA 数据分析师:业务数据分析步骤的落地者与价值优化者 业务数据分析是企业解决日常运营问题、提升执行效率的核心手段,其价值 ...
2025-09-12用 SQL 验证业务逻辑:从规则拆解到数据把关的实战指南 在业务系统落地过程中,“业务逻辑” 是连接 “需求设计” 与 “用户体验 ...
2025-09-11塔吉特百货孕妇营销案例:数据驱动下的精准零售革命与启示 在零售行业 “流量红利见顶” 的当下,精准营销成为企业突围的核心方 ...
2025-09-11