
大数据的未来–个人信息/情报/认知服务的思考
1.未来大数据的一切都都关于人
不论述
2.大数据收集困难和高风险
现在的大数据的来源,都是通过自有平台收集用户数据的,对于没有平台的企业很难有机制和渠道获取稳定的数据来源。
有说通过法律和制度来,规范关于人的大数据使用,在这之前,唯一可行的方向是,把用户大数据使用,做成服务的必选功能,要使用服务,必须接受隐私风险。
3.对大数据的利用方式
现在的大数据 都是由各种数据聚合出一类关于人的结论 然后拿给企业使用。
我想大数据应用还有另一类。
利用网上的大数据,告诉某类人、甚至某个人,世界发生着什么,未来要发生什么。
4.科幻大片
如果从网上下载一个专属的虚拟人物(虚拟机器人/虚拟助理/终生人工智能伴侣)到手机。
刚开始这个角色需要你教导(配置,类似早期的语音识别控制的学习阶段)才能帮你在互联网上你做一些简单的事情。
随着你教导的更多更好(对你的习惯,兴趣爱好,思维模式,接收度等信息的收集) 和基于大数据的挖掘和分析能力的增加,它的智力越来越高,能做一些更复杂的任务(作为入口,代表你在互联网活动)。
直到很多年后,它的智力超过你,它能告诉你,世界发生着什么,未来要发生什么,它了解你的年龄,了解的行为习惯,了解你的经济能力,了解你缺点,时刻为你服务,扩展你的人生,使你的人生不局限于经验(网上有),思维(网上有),能更好的生活下去(帮你发现机会)。
类似的东西,后来才发现微软小冰二代已经在着手做了,可能愿景和目的不一样,但轮廓有了。
5.认知需求
我们成长的时候,家长常常说你懂点事吧,但如何懂事没有人能教给我们,也没有告诉我们如何去做(去阅读书籍,去体验生活,经历人生);
我们毕业了,工作了,在社会上依然遇到,各种成功学大师,各种领域专家,各种百家讲坛老师,各种转世神棍,大行其道;
这一切都是因为,人有认知的需求。
6.认知培训
基于这个需求,认知服务即使做不到自动,就算做人工服务,也能在现在的教育市场(学校,兴趣培训,英语培训,等技能培训)杀出一条出路。
7.认知模式与三分的认知世界
莱考夫(George Lakoff)在 [女人、火和危险的事物]([Women fire and dangerous things])一书中,认为理念化的认知模式(idealized cognitive models 简称ICMs)是结构复杂的感知整体,是对世界的整体表征,它的价值在于对输入信息进行重组。ICMs并不客观存在的,而是人类实践和经验的高度概括和总 结,并且可以为以后的实践提供参考。根据lakoff的论述,IMCs有四种:命题模式,意向图式模式,隐喻模式和转喻模式,它们的关系如下:
命题模式是出发点和归宿,意象图式模式是基础,转喻模式和隐喻模式是建立在命题模式和意象图式模式上的认知事物的过程和方式,并且二者相互作用。
任一认知主体的认知世界整体可以划分为三个部分:信念世界、怀疑世界和无知世界。我们用Wb表示信念世界,Wd表示怀疑世界,Wu表示 无知世界。Wb、Wd、Wu是三个命题集合,他们的元素是相应的认知命题。简单地说,信念世界是由认知主体相信的命题构成,这些命题构成认知主体的信念; 怀疑世界里的所有命题是认知世界说怀疑的,认知主体认为这些命题是假的或不可能的,这些命题可称为疑点;认知主体从来没有考虑过的命题构 成无知世界的内容,这些命题(以及它们的负命题)或者仍没有进入认知主体的视野之中,或者虽然进入了认知主体的视野之中但认知主体不知道其意义,此时,认 知主体对之既不相信又不怀疑,这些命题可称之为盲点。
8.认知互联网世界进而认知现实世界
互联网世界一直是互联网世界的映射,越来越多的现实世界事物在互联网世界建立了数字化的映射"
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10