京公网安备 11010802034615号
经营许可证编号:京B2-20210330
人类与悬浮在水中的花粉其实没有什么不同,花粉的运动只是水中分子不断撞击造成的,而人类的活动是由一系列任务、责任、欲望驱使。分子的运动是可以预测的,而以往人类活动却无迹可循。在互联网快速发展的今天,人类各类活动被记录在数据库中,从而为研究人类活动提供了足够数据。
大量的社交工具都具有LBS功能,微薄,微信,陌陌,地图查询等,正在暴露你的踪迹,你运动的轨迹也被预测。我们正生活在一个大曝光时代。
一条新闻或一篇文章需要多长时间才会出现半衰期呢?答案是将近36小时。通过观察网络媒体发现此规律。热点总是被新的热点抢走曝光点。
人类的行为模型是随机的吗?根据泊松概率的说法,将人类的行为假设为随机,那么我们的行为轨迹将是无法预测的,然而通过大量数据的考究人类的行为还是可以预测到的,并且达到93%。
不论我们观察哪种人类活动,都会发现相同的“爆发”理论;长时间休息之后就会出现短时间的密集活动。工作、生活中我们总是会有意或无意的设置优先级,而优先级的设定,不可避免的出现幂律分布和爆发的出现。因为我们会在短时间内处理几件最重要,最紧急的事情,然后进入会短暂的休息状态。
无论你信与不信,我们都是习惯的奴隶,每个人都在自己的习惯驱使下,表演者人生的戏,无论精彩与否都是习惯的表现,无论你生活的圈子有多大,而你的行为都是可以预测的,并且符合高斯分布,准确率可高达93%。
我们平时发邮件以及打电话的数量时,我们遵循幂律规律,而幂律的出现,必然出现爆发的现象。
不管是年轻人,中年人,还是老年人,所有人的可预测程度都差不多。其中只有一个想象值得注意:与女人相比,男人的可预测程度要低一些。
你是否还以为你和别人不同,你是独一无二的,是否还觉得你别人相比你更加规律或更加不规律。其实只要把你的生活量化后,你的可预测程序与其他人并无异,都是知识习惯的奴隶。
如果你要知道你五年之后在那个位置,那么通过研究你的过去你能预知到,当然如果你的生活习惯不规律行(所谓的异类)非常高,那么预测准确率可能只能到达80%左右,如果你生活习惯非常规律,那么准确率高达93%。—验证了一句俗话:要想预知未来,必先了解过去。—把握现在,才能有美好未来
针对用户投放广告是商家梦寐以求的,产品推广更加准确,或许没让用户没那么反感,要达到此效果,需要有大量的数据,通过数据分析用户的喜好,这里涉及到一个隐私问题,用户是否习惯被窥探隐私呢?
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析与建模中,“显性特征”(如用户年龄、订单金额、商品类别)是直接可获取的基础数据,但真正驱动业务突破的往往是 “ ...
2025-11-07在大模型(LLM)商业化落地过程中,“结果稳定性” 是比 “单次输出质量” 更关键的指标 —— 对客服对话而言,相同问题需给出一 ...
2025-11-07在数据驱动与合规监管双重压力下,企业数据安全已从 “技术防护” 升级为 “战略刚需”—— 既要应对《个人信息保护法》《数据安 ...
2025-11-07在机器学习领域,“分类模型” 是解决 “类别预测” 问题的核心工具 —— 从 “垃圾邮件识别(是 / 否)” 到 “疾病诊断(良性 ...
2025-11-06在数据分析中,面对 “性别与购物偏好”“年龄段与消费频次”“职业与 APP 使用习惯” 这类成对的分类变量,我们常常需要回答: ...
2025-11-06在 CDA(Certified Data Analyst)数据分析师的工作中,“可解释性建模” 与 “业务规则提取” 是核心需求 —— 例如 “预测用户 ...
2025-11-06在分类变量关联分析中(如 “吸烟与肺癌的关系”“性别与疾病发病率的关联”),卡方检验 P 值与 OR 值(比值比,Odds Ratio)是 ...
2025-11-05CDA 数据分析师的核心价值,不在于复杂的模型公式,而在于将数据转化为可落地的商业行动。脱离业务场景的分析只是 “纸上谈兵” ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-04【2025最新版】CDA考试教材:CDA教材一级:商业数据分析(2025)__商业数据分析_cda教材_考试教材 (cdaglobal.com) ...
2025-11-04在数字化时代,数据挖掘不再是实验室里的技术探索,而是驱动商业决策的核心能力 —— 它能从海量数据中挖掘出 “降低成本、提升 ...
2025-11-04在 DDPM(Denoising Diffusion Probabilistic Models)训练过程中,开发者最常困惑的问题莫过于:“我的模型 loss 降到多少才算 ...
2025-11-04在 CDA(Certified Data Analyst)数据分析师的工作中,“无监督样本分组” 是高频需求 —— 例如 “将用户按行为特征分为高价值 ...
2025-11-04当沃尔玛数据分析师首次发现 “啤酒与尿布” 的高频共现规律时,他们揭开了数据挖掘最迷人的面纱 —— 那些隐藏在消费行为背后 ...
2025-11-03这个问题精准切中了配对样本统计检验的核心差异点,理解二者区别是避免统计方法误用的关键。核心结论是:stats.ttest_rel(配对 ...
2025-11-03在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次 ...
2025-11-03在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31