京公网安备 11010802034615号
经营许可证编号:京B2-20210330
动荡时代:机器智能与大数据下的“阴霾”
记得在一部科幻电影中,一群人因为外星人的到来而在楼顶狂呼欢迎,但随之而来的先是巨大飞船下的一片阴影,接下来就是外星人的一束光炮,这群人和大楼随之灰飞烟灭。有的时候我们过多关注技术好的一面,但实际上技术与对社会的重构相叠加才真正塑造未来的具体形态。技术发展下去,必会逐步挖去现有社会的存在根基,直至社会需要再平衡,全面进入一个动荡的时代。占领华尔街也许正是这种变化的一种隐晦征兆,愤懑的人们面对这种变化其实是很迷茫的,他们只知道自己是99%,却不知道应该提倡什么,还是反对什么。
大数据与机器智能的本质含义
在自然界里由无机物到有机物,由单细胞到多细胞,由爬行动物到哺乳动物,由本能驱动到智慧驱动这种进化路线大家已经耳熟能详,而所有这一切似乎根本的目的都是为了产生人类的智慧,人的智慧是这进化链条的巅峰。如果有神,那确实可以认为神是通过进化复制了自己,创造了人类所独有的智慧,通过这智慧人类可以去认知宇宙中普遍的自然法则。
现在获得了智慧的人类则开始重复这一过程。
我们先制造最原始的石器,接下来考虑给它赋予动力,就有蒸汽机、电力的产生,再接下来就考虑让工具能分担脑子做的事情,比如计算,就有了计算机,之后则希望计算机处理更加复杂的东西比如情绪的识别、图像的识别、自然语言处理、语音识别等,这条进化路线的终点则是机器智能。自然界根据自己复制出了我们,我们根据自己创造机器智能。所以机器智能是否可以达到我们自己的程度,其实依赖于我们人类的能力是否有一个边界,是否能真的成为造物主。
大数据则是机器智能的必要支撑,现在看来它是让机器智能水平有较大的突破的一个关键因素。一个典型的例子是颠覆式创新研习社的课上吴军老师讲的,他说在算法基本不变的情形下,单纯通过把数据量加大1万倍,那在翻译中文的时候准确程度可以增加5%。
人产生智能之后,从自然界的手中接过了改造地球的权利,从外太空回看地球,雄美壮丽的极光属于自然,但万家灯火则属于人类。现在要接替人类的则是机器智能。
机器智能产生后至少在一切可以有简单重复、量又巨大的地方会取代人类。这是不可逆转的趋势,并且也正在发生。显然如果有1T的档案数据需要分析,靠人是完全不靠谱的。
从机器智能的具体进展来看,机器学习、自然语言处理、语音识别、图像识别等都已经有了可见的成果,至少是基本可用的级别。各种机器人产品其实可以算作这些技术的一种综合应用,机器人的完善程度越高,说明机器智能的水平越高,当然你不能把机器人局限为类人形机器人。下一个里程牌是出现一种大众化的机器智能产品,无人机或者无人驾驶汽车也许可以第一个对此进行突破,其次才是Pepper,Jibo这种机器人。但不管怎样,机器智能在没产生自主意识之前部分代替人类改造世界,已经是种必然,并且为期不远。
这无疑是一种巨大的社会进化机遇,人类总算有一种机会,在人类社会最底层塞上一层东西,把整个人类社会往上进行平移,让大多的人从物质困扰中解脱出来(影响范围和力度的大小和能源的突破有内在关联)。
内在的集中趋势
大自然造人的时候是由一到多,我们每个人具有独立意识,但机器智能的存在模式正与此相反,事实上我们只需要一个机器智能。机器人的个数等也许模糊了这个事实,但拍电影时大家显然意识到了这点,所以矩阵其实只有一个。
在摸索阶段,不同的人思路不同所以也许会有多种不同类型的机器智能,比如它主打深度学习,你则依赖于对大脑皮层的模拟,但可以肯定的是同一类型的机器智能不需要多个。多个Watson其实只有形式上的价值,不管做多少事情Watson这种机器智能有一个就够了。
这意味着机器智能先天具有中心化的趋势,从长期视角来看,最终需要存在的机器智能最多也只可能是一个类别一个。
即使在发展过程中,这种内在的集中化趋势也会让机器智能的浪潮与此前的浪潮不同。
机器智能的核心支撑现在看来就是两个:一个技术本身,一个则是数据。这对草根并不是什么好消息。有些机会是比较大众的,比如移动互联网上的App,有的机会是比较小众的,比如修铁道。现在看来机器智能更像是一种只有小众才有机会的浪潮,在机器智能这浪潮所创造的机会中显然拥有技术的和拥有数据的会有优势。
拥有核心技术是指机器智能算法本身,在自然语言处理、计算机视觉这些方面有高超的水平,这通常是大公司和一些科研的人才具备的优势;拥有数据的通常是已经有一定事业和社会资源的人。前者由于开源和机器智能即服务的存在在大多时候是可以跨越的,有难度的通常是后者,比如一般来讲你并不能获得医院的数据。
所以说机器智能所带动的新领域里,游戏规则更可能与PC互联网、移动互联网不一样,会更加的集中。
把人类社会普遍提高一层,以及这种内在的集中化趋势显然会带来问题。
人的身生活与心生活
有个简单视角有助于看清人生很多事情。
当把人生看成一团能量,把生活看成“身生活”和“心生活”的叠加,那就会发现这团能量要么注重“身生活”,要么注重“心生活”。随着这能量分配方式和程度的不同就形成各种文化和人生。但不管怎么强调“心生活”,包括对彼岸的向往,历史上,人类绝大多时候是把人生这团能量分配在“身生活”上的,这就和动物的一生大多时候是在找吃的差不多。这反过来意味着我们的社会大体上是按照把人生这团能量分配在“身生活”上进行组织的,大多数人财务不自由,普遍面临着自己或家人的生存压力。
接下来这种生活模式终于可以有一个改变的机会,人类金字塔的最下层整个的会被塞上一层东西,借助机器智能,所有的“身生活”相关的东西可以很廉价乃至免费的获取到了,这绝对会改变社会的基本结构。
这是好事情,但也蕴含着风险,这风险至少短期并不来自于霍金等所担心的机器智能灭杀人类,而是来自于这种变化本身对社会结构的冲击。我们还不太知道一个大多数人可以拥有大量闲暇时间的社会究竟该如何去组织。在过去,大多数人通过劳动获取收入,利用较少的闲暇时间来消耗这收入,但接下来他们的劳动会变得没有价值,而同时拥有大量的闲暇时间。只有2%的人才是忙碌者,能在创造大量财富的同时维持原有的生活模式。
现有的生产模式和社会结构肯定不足以解决这问题,而可以想见的方式往往涉及巨大的改变,比如说:
一种方式是实际上很残酷的喂奶策略。这种策略下社会会分解为两个阶层:一层忙碌的实现自我,一层则不知道干什么,但维持着最基本的生存条件,能够生活下去。这可以拿发达大都市与非洲部落做个参照,并放大其规模和程度。比如让大都市发达十倍,人口缩减到十分之一,部落保持不变但人口增加十倍。这虽然保持了人道的基本底线,但其实也还是很残酷的。在《第九区》这电影里,曾经讲述了一个人类这样对待大虾一样的外星人的故事。
一种方式则是更加社会化,重回一种极为严密的配给经济,至少是基本生活资料上的配给。这时候“身生活”相关的部分是彻底社会化的,不需要经济考量。过去对此的尝试是计划经济,并导致了不小的灾难,但大家可能没注意到,当人变成透明人,机器智能把人类社会普遍抬升一层之后,计划的可能性是在重新开始增长的。在这前提下,人生的能量就可以更多的投放在“心生活”里,也许在精神的世界里可以发现一个无限容纳人生能量的世界,比如审美和艺术、比如探索宇宙等。接下来再在这个上建造新的经济形态。
一种方式则是战争。战争消灭人口的同时,大量问题也会随之被消灭。
人类的智慧一定可以想象出更多的方式,有些我们暂时还无法想象,但比较确定的一点是社会保持原样已经不太可能。而社会基本模式的变化一定会产生动荡,所以我们即将面对的是一个动荡的时代。即使《奇点临近》说的东西只有一半是对的,那这种动荡都很可能会在未来三十年内逐步发生。
小结
PC互联网、移动互联网、IOT、大数据、机器智能等东西的兴起,短期看只是一个个创业的机会,但实际上这些东西也在重塑这个社会的根基。一旦这种量变达到一定程度,显著变化就会出现在我们面前。一个不好的比喻是老鼠在嗑柱子的时候,只知道柱子在变细,但往往会忽略柱子在下一刻随时可能倒下来。这比喻虽然负面,但所谓动荡时代真的很像柱子倒下来那一刻。上面说的变化是确定的,所以从趋势来看动荡时代其实也是确定的。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04 很多数据分析师拿到数据就开始清洗、建模,但当被问到“这批数据属于什么类型——结构化还是非结构化?分类变量还是数值变量 ...
2026-06-04在问卷调查与社会科学数据分析中,卡方检验是最常用、最基础的非参数检验方法,广泛应用于市场调研、用户分析、行为统计、满意度 ...
2026-06-03【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-03 很多数据分析师画过趋势图、做过业绩预测,但当被问到“这个月销售额增长20%,到底是长期趋势自然增长,还是促销活动的短期 ...
2026-06-03逻辑回归是数据分析、机器学习、统计建模中应用最广泛的二分类预测模型,常用于风险判断、行为预测、归因分析等场景。在SPSS、Py ...
2026-06-02数字经济时代,市场竞争日趋同质化,用户消费需求愈发个性化、多元化,传统依托经验、粗放式、广撒网的营销模式弊端日益凸显。长 ...
2026-06-02 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-06-02在市场竞争日趋饱和、用户需求不断细分的当下,企业创业创新、产品迭代与市场拓展不再依赖经验决策,而是需要系统化、工具化的商 ...
2026-06-01【核心关键词】调度、岗位、数据库、企业、报表、培训、程序、数据分析、数据加工、业务部门、企业数据、调度工具、业务指标、 ...
2026-06-01 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-06-01在数据统计分析、数据清洗、异常值识别与数据分布研究中,箱型图是最直观、高效、专业的可视化分析工具。相较于柱状图、折线图仅 ...
2026-05-29Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程 ...
2026-05-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-05-29【核心关键词】大数据、经理、专业、金融、客户、传统、建模、数据产品、互联网金融、产品经理、数据分析、金融行业、数据模型 ...
2026-05-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-05-28