京公网安备 11010802034615号
经营许可证编号:京B2-20210330
动荡时代:机器智能与大数据下的“阴霾”
记得在一部科幻电影中,一群人因为外星人的到来而在楼顶狂呼欢迎,但随之而来的先是巨大飞船下的一片阴影,接下来就是外星人的一束光炮,这群人和大楼随之灰飞烟灭。有的时候我们过多关注技术好的一面,但实际上技术与对社会的重构相叠加才真正塑造未来的具体形态。技术发展下去,必会逐步挖去现有社会的存在根基,直至社会需要再平衡,全面进入一个动荡的时代。占领华尔街也许正是这种变化的一种隐晦征兆,愤懑的人们面对这种变化其实是很迷茫的,他们只知道自己是99%,却不知道应该提倡什么,还是反对什么。
大数据与机器智能的本质含义
在自然界里由无机物到有机物,由单细胞到多细胞,由爬行动物到哺乳动物,由本能驱动到智慧驱动这种进化路线大家已经耳熟能详,而所有这一切似乎根本的目的都是为了产生人类的智慧,人的智慧是这进化链条的巅峰。如果有神,那确实可以认为神是通过进化复制了自己,创造了人类所独有的智慧,通过这智慧人类可以去认知宇宙中普遍的自然法则。
现在获得了智慧的人类则开始重复这一过程。
我们先制造最原始的石器,接下来考虑给它赋予动力,就有蒸汽机、电力的产生,再接下来就考虑让工具能分担脑子做的事情,比如计算,就有了计算机,之后则希望计算机处理更加复杂的东西比如情绪的识别、图像的识别、自然语言处理、语音识别等,这条进化路线的终点则是机器智能。自然界根据自己复制出了我们,我们根据自己创造机器智能。所以机器智能是否可以达到我们自己的程度,其实依赖于我们人类的能力是否有一个边界,是否能真的成为造物主。
大数据则是机器智能的必要支撑,现在看来它是让机器智能水平有较大的突破的一个关键因素。一个典型的例子是颠覆式创新研习社的课上吴军老师讲的,他说在算法基本不变的情形下,单纯通过把数据量加大1万倍,那在翻译中文的时候准确程度可以增加5%。
人产生智能之后,从自然界的手中接过了改造地球的权利,从外太空回看地球,雄美壮丽的极光属于自然,但万家灯火则属于人类。现在要接替人类的则是机器智能。
机器智能产生后至少在一切可以有简单重复、量又巨大的地方会取代人类。这是不可逆转的趋势,并且也正在发生。显然如果有1T的档案数据需要分析,靠人是完全不靠谱的。
从机器智能的具体进展来看,机器学习、自然语言处理、语音识别、图像识别等都已经有了可见的成果,至少是基本可用的级别。各种机器人产品其实可以算作这些技术的一种综合应用,机器人的完善程度越高,说明机器智能的水平越高,当然你不能把机器人局限为类人形机器人。下一个里程牌是出现一种大众化的机器智能产品,无人机或者无人驾驶汽车也许可以第一个对此进行突破,其次才是Pepper,Jibo这种机器人。但不管怎样,机器智能在没产生自主意识之前部分代替人类改造世界,已经是种必然,并且为期不远。
这无疑是一种巨大的社会进化机遇,人类总算有一种机会,在人类社会最底层塞上一层东西,把整个人类社会往上进行平移,让大多的人从物质困扰中解脱出来(影响范围和力度的大小和能源的突破有内在关联)。
内在的集中趋势
大自然造人的时候是由一到多,我们每个人具有独立意识,但机器智能的存在模式正与此相反,事实上我们只需要一个机器智能。机器人的个数等也许模糊了这个事实,但拍电影时大家显然意识到了这点,所以矩阵其实只有一个。
在摸索阶段,不同的人思路不同所以也许会有多种不同类型的机器智能,比如它主打深度学习,你则依赖于对大脑皮层的模拟,但可以肯定的是同一类型的机器智能不需要多个。多个Watson其实只有形式上的价值,不管做多少事情Watson这种机器智能有一个就够了。
这意味着机器智能先天具有中心化的趋势,从长期视角来看,最终需要存在的机器智能最多也只可能是一个类别一个。
即使在发展过程中,这种内在的集中化趋势也会让机器智能的浪潮与此前的浪潮不同。
机器智能的核心支撑现在看来就是两个:一个技术本身,一个则是数据。这对草根并不是什么好消息。有些机会是比较大众的,比如移动互联网上的App,有的机会是比较小众的,比如修铁道。现在看来机器智能更像是一种只有小众才有机会的浪潮,在机器智能这浪潮所创造的机会中显然拥有技术的和拥有数据的会有优势。
拥有核心技术是指机器智能算法本身,在自然语言处理、计算机视觉这些方面有高超的水平,这通常是大公司和一些科研的人才具备的优势;拥有数据的通常是已经有一定事业和社会资源的人。前者由于开源和机器智能即服务的存在在大多时候是可以跨越的,有难度的通常是后者,比如一般来讲你并不能获得医院的数据。
所以说机器智能所带动的新领域里,游戏规则更可能与PC互联网、移动互联网不一样,会更加的集中。
把人类社会普遍提高一层,以及这种内在的集中化趋势显然会带来问题。
人的身生活与心生活
有个简单视角有助于看清人生很多事情。
当把人生看成一团能量,把生活看成“身生活”和“心生活”的叠加,那就会发现这团能量要么注重“身生活”,要么注重“心生活”。随着这能量分配方式和程度的不同就形成各种文化和人生。但不管怎么强调“心生活”,包括对彼岸的向往,历史上,人类绝大多时候是把人生这团能量分配在“身生活”上的,这就和动物的一生大多时候是在找吃的差不多。这反过来意味着我们的社会大体上是按照把人生这团能量分配在“身生活”上进行组织的,大多数人财务不自由,普遍面临着自己或家人的生存压力。
接下来这种生活模式终于可以有一个改变的机会,人类金字塔的最下层整个的会被塞上一层东西,借助机器智能,所有的“身生活”相关的东西可以很廉价乃至免费的获取到了,这绝对会改变社会的基本结构。
这是好事情,但也蕴含着风险,这风险至少短期并不来自于霍金等所担心的机器智能灭杀人类,而是来自于这种变化本身对社会结构的冲击。我们还不太知道一个大多数人可以拥有大量闲暇时间的社会究竟该如何去组织。在过去,大多数人通过劳动获取收入,利用较少的闲暇时间来消耗这收入,但接下来他们的劳动会变得没有价值,而同时拥有大量的闲暇时间。只有2%的人才是忙碌者,能在创造大量财富的同时维持原有的生活模式。
现有的生产模式和社会结构肯定不足以解决这问题,而可以想见的方式往往涉及巨大的改变,比如说:
一种方式是实际上很残酷的喂奶策略。这种策略下社会会分解为两个阶层:一层忙碌的实现自我,一层则不知道干什么,但维持着最基本的生存条件,能够生活下去。这可以拿发达大都市与非洲部落做个参照,并放大其规模和程度。比如让大都市发达十倍,人口缩减到十分之一,部落保持不变但人口增加十倍。这虽然保持了人道的基本底线,但其实也还是很残酷的。在《第九区》这电影里,曾经讲述了一个人类这样对待大虾一样的外星人的故事。
一种方式则是更加社会化,重回一种极为严密的配给经济,至少是基本生活资料上的配给。这时候“身生活”相关的部分是彻底社会化的,不需要经济考量。过去对此的尝试是计划经济,并导致了不小的灾难,但大家可能没注意到,当人变成透明人,机器智能把人类社会普遍抬升一层之后,计划的可能性是在重新开始增长的。在这前提下,人生的能量就可以更多的投放在“心生活”里,也许在精神的世界里可以发现一个无限容纳人生能量的世界,比如审美和艺术、比如探索宇宙等。接下来再在这个上建造新的经济形态。
一种方式则是战争。战争消灭人口的同时,大量问题也会随之被消灭。
人类的智慧一定可以想象出更多的方式,有些我们暂时还无法想象,但比较确定的一点是社会保持原样已经不太可能。而社会基本模式的变化一定会产生动荡,所以我们即将面对的是一个动荡的时代。即使《奇点临近》说的东西只有一半是对的,那这种动荡都很可能会在未来三十年内逐步发生。
小结
PC互联网、移动互联网、IOT、大数据、机器智能等东西的兴起,短期看只是一个个创业的机会,但实际上这些东西也在重塑这个社会的根基。一旦这种量变达到一定程度,显著变化就会出现在我们面前。一个不好的比喻是老鼠在嗑柱子的时候,只知道柱子在变细,但往往会忽略柱子在下一刻随时可能倒下来。这比喻虽然负面,但所谓动荡时代真的很像柱子倒下来那一刻。上面说的变化是确定的,所以从趋势来看动荡时代其实也是确定的。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在零售行业从“流量争夺”转向“价值深耕”的演进中,塔吉特百货(Target)以两场标志性实践树立了行业标杆——2000年后的孕妇精 ...
2025-12-15在统计学领域,二项分布与卡方检验是两个高频出现的概念,二者都常用于处理离散数据,因此常被初学者混淆。但本质上,二项分布是 ...
2025-12-15在CDA(Certified Data Analyst)数据分析师的工作链路中,“标签加工”是连接原始数据与业务应用的关键环节。企业积累的用户行 ...
2025-12-15在Python开发中,HTTP请求是与外部服务交互的核心场景——调用第三方API、对接微服务、爬取数据等都离不开它。虽然requests库已 ...
2025-12-12在数据驱动决策中,“数据波动大不大”是高频问题——零售店长关心日销售额是否稳定,工厂管理者关注产品尺寸偏差是否可控,基金 ...
2025-12-12在CDA(Certified Data Analyst)数据分析师的能力矩阵中,数据查询语言(SQL)是贯穿工作全流程的“核心工具”。无论是从数据库 ...
2025-12-12很多小伙伴都在问CDA考试的问题,以下是结合 2025 年最新政策与行业动态更新的 CDA 数据分析师认证考试 Q&A,覆盖考试内容、报考 ...
2025-12-11在Excel数据可视化中,柱形图因直观展示数据差异的优势被广泛使用,而背景色设置绝非简单的“换颜色”——合理的背景色能突出核 ...
2025-12-11在科研实验、商业分析或医学研究中,我们常需要判断“两组数据的差异是真实存在,还是偶然波动”——比如“新降压药的效果是否优 ...
2025-12-11在CDA(Certified Data Analyst)数据分析师的工作体系中,数据库就像“数据仓库的核心骨架”——所有业务数据的存储、组织与提 ...
2025-12-11在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02