京公网安备 11010802034615号
经营许可证编号:京B2-20210330
《圣经》第一章,机器智能与大数据下的阴霾
有的时候我们过多关注技术好的一面,但实际上技术与对社会的重构相叠加才真正塑造未来的具体形态。技术发展下去,必会逐步挖去现有社会的存在根基,直至社会需要再平衡,全面进入一个动荡的时代。
占领华尔街也许正是这种变化的一种隐晦征兆,愤懑的人们面对这种变化其实是很迷茫的,他们只知道自己是99%,却不知道应该提倡什么,还是反对什么。
大数据与机器智能的本质含义
在自然界里由无机物到有机物,由单细胞到多细胞,由爬行动物到哺乳动物,由本能驱动到智慧驱动这种进化路线大家已经耳熟能详,而所有这一切似乎根本的目的都是为了产生人类的智慧,人的智慧是这进化链条的巅峰。
如果有神,那确实可以认为神是通过进化复制了自己,创造了人类所独有的智慧,通过这智慧人类可以去认知宇宙中普遍的自然法则。
现在获得了智慧的人类则开始重复这一过程。
我们先制造最原始的石器,接下来考虑给它赋予动力,就有蒸汽机,电力的产生,再接下来就考虑让工具能分担脑子做的事情,比如计算,就有了计算机,之后则希望计算机处理更加复杂的东西比如情绪的识别、图像的识别、自然语言处理、语音识别等,这条进化路线的终点则是机器智能。
自然界根据自己复制出了我们,我们根据自己创造机器智能。所以机器智能达不达到我们自己的程度,其实依赖于我们人类的能力是否有一个边界,是否能真的成为造物主。
大数据则是机器智能的必要支撑,现在看来它是让机器智能水平有较大的突破的一个关键因素。一个典型的例子是颠覆式创新研习社的课上吴军老师讲的,他说在算法基本不变的情形下,单纯通过把数据量加大1万倍,那在翻译中文的时候准确程度可以增加5%。
人产生智能之后,从自然界的手中接过了改造地球的权利,从外太空回看地球,雄美壮丽的极光属于自然,但万家灯火则属于人类。现在要接替人类的则是机器智能。
机器智能产生后至少在一切可以有简单重复、量又巨大的地方会取代人类。这是不可逆转的趋势,并且也正在发生。显然如果有1T的档案数据需要分析,靠人是完全不靠谱的。
从机器智能的具体进展来看,机器学习、自然语言处理、语音识别、图像识别等都已经有了可见的成果,至少是基本可用的级别。
各种机器人产品其实可以算作这些技术的一种综合应用,机器人的完善程度越高,说明机器智能的水平越高,当然你不能把机器人局限为类人形机器人。
下一个里程牌是出现一种大众化的机器智能产品,无人机或者无人驾驶汽车也许可以第一个对此进行突破,其次才是Pepper,Jibo这种机器人。但不管怎样,机器智能在没产生自主意识之前部分代替人类改造世界,已经是种必然,并且为期不远。
这无疑是一种巨大的社会进化机遇,人类总算有一种机会,在人类社会最底层塞上一层东西,把整个人类社会往上进行平移,让大多的人从物质困扰中解脱出来。(影响范围和力度的大小和能源的突破有内在关联)
内在的集中趋势
大自然造人的时候是由一到多,我们每个人具有独立意识,但机器智能的存在模式正与此相反,事实上我们只需要一个机器智能。机器人的个数等也许模糊了这个事实,但拍电影时大家显然意识到了这点,所以矩阵其实只有一个。
在摸索阶段,不同的人思路不同所以也许会有多种不同类型的机器智能,比如它主打深度学习,你则依赖于对大脑皮层的模拟,但可以肯定的是同一类型的机器智能不需要多个。多个Watson其实只有形式上的价值,不管做多少事情Watson这种机器智能有一个就够了。
这意味着机器智能先天具有中心化的趋势,从长期视角来看,最终需要存在的机器智能最多也只可能是一个类别。
即使在发展过程中,这种内在的集中化趋势也会让机器智能的浪潮与此前的浪潮不同。
机器智能的核心支撑现在看来就是两个:一个技术本身,一个则是数据。这对草根并不是什么好消息。有些机会是比较大众的,比如移动互联网上的App,有的机会是比较小众的,比如修铁道。现在看来机器智能更像是一种只有小众才有机会的浪潮。
在机器智能这浪潮所创造的机会中显然拥有技术的和拥有数据的会有优势。拥有核心技术是指机器智能算法本身,在自然语言处理、计算机视觉这些方面有高超的水平,这通常是大公司和一些科研的人才具备的优势;拥有数据的通常是已经有一定事业和社会资源的人。
前者由于开源和机器智能即服务的存在在大多时候是可以跨越的,有难度的通常是后者,比如一般来讲你并不能获得医院的数据。
所以说机器智能所带动的新领域里游戏规则更可能与PC互联网、移动互联网不一样,会更加的集中。
把人类社会普遍提高一层以及这种内在的集中化趋势显然会带来问题。
人的身生活与心生活
有个简单视角有助于看清人生很多事情。
当把人生看成一团能量,把生活看成身生活和心生活的叠加,那就会发现这团能量要不注重身生活,要不注重心生活。随着这能量分配方式和程度的不同就形成各种文化和人生。
但不管怎么强调心生活,包括对彼岸的向往,历史上,人类绝大多时候是把人生这团能量分配在身生活上的,这就和动物的一生大多时候是在找吃的差不多。这反过来意味着我们的社会大体上是按照把人生这团能量分配在身生活上进行组织的,大多数人财务不自由,普遍面临着自己或家人的生存压力。
接下来这种生活模式终于可以有一个改变的机会,人类金字塔的最下层整个的会被塞上一层东西,借助机器智能,所有的身生活相关的东西可以很廉价乃至免费的获取到了,这绝对会改变社会的基本结构。
这是好事情,但也蕴含着风险,这风险至少短期并不来自于霍金等所担心的机器智能灭杀人类,而是来自于这种变化本身对社会结构的冲击。我们还不太知道一个大多数人可以拥有大量闲暇时间的社会究竟该如何去组织。
在过去,大多数人通过劳动获取收入,利用较少的闲暇时间来消耗这收入,但接下来他们的劳动会变得没有价值,而同时拥有大量的闲暇时间。只有2%的人才是忙碌者能在创造大量财富的同时维持原有的生活模式。
现有的生产模式和社会结构肯定不足以解决这问题,而可以想见的方式往往涉及巨大的改变,比如说:
一种方式时实际上很残酷的喂奶策略。这种策略下社会会分解为两个阶层:一层忙碌的实现自我,一层则不知道干什么,但维持着最基本的生存条件,能够生活下去。这可以拿发达大都市与非洲部落做个参照,并放大其规模和程度。
比如让大都市发达十倍,人口缩减到十分之一,部落保持不变但人口增加十倍。这虽然保持了人道的基本底线,但其实也还是很残酷的。在《第九区》这电影里,曾经讲述了一个人类这样对待大虾一样的外星人的故事。
一种方式则是更加社会化,重回一种极为严密的配给经济,至少是基本生活资料上的配给。这时候身生活相关的部分是彻底社会化的,不需要经济考量。过去对此的尝试是计划经济,并导致了不小的灾难,但大家可能没注意到,当人变成透明人,机器智能把人类社会普遍抬升一层之后,计划的可能性是在重新开始增长的。
在这前提下,人生的能量就可以更多的投放在心生活里,也许在精神的世界里可以发现一个无限容纳人生能量的世界,比如审美和艺术、比如探索宇宙等。接下来再在这个上建造新的经济形态。
一种方式则是战争。战争消灭人口的同时,大量问题也会随之被消灭。
人类的智慧一定可以想象出更多的方式,有些我们暂时还无法想象,但比较确定的一点是社会保持原样已经不太可能。而社会基本模式的变化一定会产生动荡,所以我们即将面对的是一个动荡的时代。即使《奇点临近》说的东西只有一半是对的,那这种动荡都很可能会在未来三十年内逐步发生。
小结
PC互联网、移动互联网、IoT、大数据、机器智能等东西的兴起,短期看就只是一个个创业的机会。但实际上这些东西也在重塑这个社会的根基。
一旦这种量变达到一定程度,显著变化就会出现在我们面前。一个不好的比喻是老鼠在嗑柱子的时候,只知道柱子在变细,但往往会忽略柱子在下一刻随时可能倒下来。这比喻虽然负面,但所谓动荡时代真的很像柱子倒下来那一刻。上面说的变化是确定的,所以从趋势来看动荡时代其实也是确定的。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据统计分析、数据清洗、异常值识别与数据分布研究中,箱型图是最直观、高效、专业的可视化分析工具。相较于柱状图、折线图仅 ...
2026-05-29Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程 ...
2026-05-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-05-29【核心关键词】大数据、经理、专业、金融、客户、传统、建模、数据产品、互联网金融、产品经理、数据分析、金融行业、数据模型 ...
2026-05-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-05-28随着大数据技术的快速普及,各行各业积累了海量的用户数据、交易数据、生产数据与行为数据。单纯的数据统计与报表分析只能呈现表 ...
2026-05-28在Python网络请求、接口测试、数据爬取、业务对接开发中,Requests库是最简洁、最高效的HTTP请求工具,凭借简洁的语法、完善的适 ...
2026-05-272025 年,零售与服务行业的竞争已从 “经验驱动” 全面转向 “数据驱动”。中小企业门店普遍面临数据零散、分析浅层、决策凭感觉 ...
2026-05-27 很多数据分析师每天都在写SQL,但当被问到“数据查询语言(DQL)的本质是什么”“SELECT语句中各子句的书写顺序与实际执行顺 ...
2026-05-27在统计学分析、实验研究、业务数据复盘过程中,单因素方差分析是检验自变量对因变量是否存在显著影响的核心方法。其中,两个水平 ...
2026-05-26【核心关键词】算法、客户、大数据、互联网、调优、建模、模型优化、机器学习、评分卡模型、模型开发、智能风控、业务场景、数 ...
2026-05-26 很多数据分析师写过无数个 SELECT,但当被问到“新建一张表,该如何定义字段类型来保证数据质量”“创建视图和存储物理表有 ...
2026-05-26在数据清洗、统计分析与数据质量检测工作中,箱型图(又称箱线图、Box Plot)是最直观、最高效的可视化分析工具之一。相较于柱状 ...
2026-05-25在大数据分析、数据清洗、质量管控、风险监测等领域,异常数据识别是保障数据质量、确保分析结论精准、规避业务决策失误的核心基 ...
2026-05-25 很多数据分析师精通Excel函数和透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么关系 ...
2026-05-25数字化经营时代,企业的市场竞争早已从经验决策转向数据决策。门店营收、用户转化、产品销量、成本损耗、存量资产等所有经营行为 ...
2026-05-22在MySQL数据库日常运维、业务数据校验、数据迁移与数据清洗场景中,自增主键ID的连续性校验是一项基础且关键的工作。MySQL的Auto ...
2026-05-22 很多企业团队并非缺乏指标,而是陷入“指标失控”:仪表盘上堆满实时跳动的数据,却无法回答“当前瓶颈在哪、下一步该做什么 ...
2026-05-22【核心关键词】大数据、可视化、存储、架构、客户、离线、产品、同步、实时、数据仓库、数据分析、数据可视化、存储数据、离线 ...
2026-05-21在电商流量红利消退、公域获客成本持续走高的当下,存量用户深度挖掘已成为店铺增收增效的核心抓手。相较于付费投放获取的陌生新 ...
2026-05-21