京公网安备 11010802034615号
经营许可证编号:京B2-20210330
城市科学大数据与社会物理学如何变革城市的发展_数据分析师培训
共享体验模式与社会纽带模式服从相同的一般规则。对社会网络中的每个人而言都是全新体验的最大的可能性,发生在人们最不常去的地方。去远处探索新想法是最有成效的,日常生活的普通体验则通过在本地社区的参与被升华为社会规范。
托马斯·杰斐逊(Thomas Jefferson)对18世纪的城市有一个著名的描述:“人性堕落的大阴沟。”但是,自杰斐逊时代以来,世界上的城市已经成百倍地增长,而且这种增长并无减弱的趋势。现在,居住在城市中的人口比例是有史以来最高的。既然城市有高昂的生活费用和比生活费用更高的犯罪率、污染程度以及传染病威胁,人们为什么还会持续不断地迁往城市?也许正如亚当·斯密所言:“城市中心既特别堕落又特别创新。”
尽管有关城市的研究已经持续了一个多世纪,我们对于为什么城市能促进创新依然缺乏一个有说服力的模型。城市确实有创新:相比于农村地区,城市更为有效地使用资源,产生更多的专利和发明,人均使用道路和服务更少。是否可以让更多人居住在一起以获得更有效的想法创新和更高的生产率?一些学者指出了技术扩散在创造智力资本中的作用,另一些人则阐述了层次化社会结构和专业化的作用。
专注于想法流而不是商品流
正如前面章节讨论的那样,社会网络互动和想法流是团队和企业里创意产出和生产率的主要推动力。这些社会物理学的概念在社会科学中几乎是仅有的可扩展的概念,并且正如本章要介绍的那样,这些概念完全可以超越小的团队和企业,扩展到城市层面,并通过这些大得多的社会网络促成更高的生产率和更大的创造力。城市和公司一样都是想法机器。
我和潘巍、格拉·戈沙尔 (Gourab Ghoshal)、科科·克鲁姆(CocoKrumme)以及曼纽尔·塞布里安(ManuelCebrian)等学生和同事一起建立了一个数学模型,它基于在面对面距离内的人数来阐述社会纽带如何推动城市里的想法流。正如我们在《自然通讯》(NatureCommunications)的一篇文章中描述的那样,这是一个定量预测GDP和创意产出的简单、自下而上、鲁棒的模型。我们也已经能够说明,沿着社会纽带的想法流可以准确再现城市特征,包括艾滋病毒感染率、电话通信模式、犯罪率和专利权率,等等。它也为我们提供了设计更具创意和效率的城市,尽可能减少犯罪和其他负面因素的研究成果。
值得注意的是,这种从社会物理学的角度看待城市的方法是与传统的阶层和专业化模型不同的。前者专注的是想法流,而不是后者描述的社会的静态分割。这样看来,社会物理学类似于用工厂之间的距离和运输物品的成本等来解释城市制造业有效性的模型。而它们的不同之处在于:社会物理学把城市和公司定位为想法工厂,因此专注于想法的流动而不是物品的流动。
从这个观点看,社会物理学与社会学、地理学和探讨人口密度与创新之间关系的经济学,以及沿着社会纽带进行的传播和创造力研究是一脉相承的。社会物理学新的重要贡献在于把这些想法集成到单一数学模型中,并可用稠密、连续的行为数据以及能够获得的经济和社会结果数据来进行检验。社会纽带和想法流在人类互动模式、移动模式和城市经济特征之间提供了简单的生成链接,无需借助层次化、专业化或类似的社会结构概念。正如本章后续部分要阐述的那样,真
正重要的是想法的流动,而不是阶层或市场。
城市中的社会纽带模式
城市中社会纽带的模式可以通过如下概念描述:两个人之间产生关系的可能性是由“中介机会”(intervening opportunities)的数量决定的。其核心思想很简单:如果你在某群人中有许多“可能认识的人”,那么你与其中某个陌生人建立友谊的可能性就比较小。大卫·利本诺尔(David LibeNowell)及其同事研究了一个日记网站的成员并绘制了他们与朋友和熟人居住距离的信息。他们发现,对于大多数朋友而言,两个人形成社会纽带的可能性与在这两人之间的地点上逗留的人数成反比。
在一个基于位置的社会网络应用Gowalla中发现了类似的关系,Gowalla记录个人及其朋友“签到”的地点。研究人员使用这些数据可以知道朋友之间居住距离的远近,以及朋友们去同一个地点的频率。这一研究得到了一个简单的数学方程,它描述了人们往往会和住在附近的人有较多的社会纽带,并且随着距离的增加,纽带的数量也越来越少。
然而,这一关于社会纽带的数学关系还有其他更为有趣的应用。例如,艾滋病这类疾病的传播显然依赖社会纽带的分布,打电话模式也是如此(当然依赖方式非常不同)。打电话模式作为区县人口的函数和艾滋病的感染率作为每平方英里人口密度的函数,这是两种非常不同的现象。然而,两者都可以用通过分析网站与社会网络所测量的距离与社会纽带数量之间相同的数学关系来预测。
城市中所有的社会纽带模式都能在更小规模的团队结构中找到对应。正如在我们关于公司的研究(第4章和第5章)中所看到的那样,亲密的社会纽带对参与有支持作用,因为这些人更有可能互相交谈,从而进一步把想法转变为行动。远距离的社会纽带则起着探索的作用,因为我们在新环境中遇见“新人”,并从他们那里收获新想法。
然而在公司里,在工作团队和“其他人”之间通常有着明确的边界。工作之外,在我们与其他人互动的整个模式中,探索和参与之间通常并没有明确的边界。也就是说,当我们考察所有的互动时,可以看到人们具有多个社会角色(例如母亲、同事、公民、爵士乐爱好者等),并且每个角色涉及不同的人群,因此,在个人社会网络中,参与和探索的功能是结合在一起的。
探索越多,城市越富足
前面的章节介绍了我的研究小组利用从手机、社会网络和社会计量标牌等大数据源采集的数据所做的研究。观察人类行为的另一个大数据透镜是信用卡数据。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在SQL数据分析与业务查询中,日期数据是高频处理对象——订单创建时间、用户注册日期、数据统计周期等场景,都需对日期进行格式 ...
2026-01-21在实际业务数据分析中,单一数据表往往无法满足需求——用户信息存储在用户表、消费记录在订单表、商品详情在商品表,想要挖掘“ ...
2026-01-21在数字化转型浪潮中,企业数据已从“辅助资源”升级为“核心资产”,而高效的数据管理则是释放数据价值的前提。企业数据管理方法 ...
2026-01-21在数字化商业环境中,数据已成为企业优化运营、抢占市场、规避风险的核心资产。但商业数据分析绝非“堆砌数据、生成报表”的简单 ...
2026-01-20定量报告的核心价值是传递数据洞察,但密密麻麻的表格、复杂的计算公式、晦涩的数值罗列,往往让读者望而却步,导致核心信息被淹 ...
2026-01-20在CDA(Certified Data Analyst)数据分析师的工作场景中,“精准分类与回归预测”是高频核心需求——比如预测用户是否流失、判 ...
2026-01-20在建筑工程造价工作中,清单汇总分类是核心环节之一,尤其是针对楼梯、楼梯间这类包含多个分项工程(如混凝土浇筑、钢筋制作、扶 ...
2026-01-19数据清洗是数据分析的“前置必修课”,其核心目标是剔除无效信息、修正错误数据,让原始数据具备准确性、一致性与可用性。在实际 ...
2026-01-19在CDA(Certified Data Analyst)数据分析师的日常工作中,常面临“无标签高维数据难以归类、群体规律模糊”的痛点——比如海量 ...
2026-01-19在数据仓库与数据分析体系中,维度表与事实表是构建结构化数据模型的核心组件,二者如同“骨架”与“血肉”,协同支撑起各类业务 ...
2026-01-16在游戏行业“存量竞争”的当下,玩家留存率直接决定游戏的生命周期与商业价值。一款游戏即便拥有出色的画面与玩法,若无法精准识 ...
2026-01-16为配合CDA考试中心的 2025 版 CDA Level III 认证新大纲落地,CDA 网校正式推出新大纲更新后的第一套官方模拟题。该模拟题严格遵 ...
2026-01-16在数据驱动决策的时代,数据分析已成为企业运营、产品优化、业务增长的核心工具。但实际工作中,很多数据分析项目看似流程完整, ...
2026-01-15在CDA(Certified Data Analyst)数据分析师的日常工作中,“高维数据处理”是高频痛点——比如用户画像包含“浏览次数、停留时 ...
2026-01-15在教育测量与评价领域,百分制考试成绩的分布规律是评估教学效果、优化命题设计的核心依据,而正态分布则是其中最具代表性的分布 ...
2026-01-15在用户从“接触产品”到“完成核心目标”的全链路中,流失是必然存在的——电商用户可能“浏览商品却未下单”,APP新用户可能“ ...
2026-01-14在产品增长的核心指标体系中,次日留存率是当之无愧的“入门级关键指标”——它直接反映用户对产品的首次体验反馈,是判断产品是 ...
2026-01-14在CDA(Certified Data Analyst)数据分析师的业务实操中,“分类预测”是高频核心需求——比如“预测用户是否会购买商品”“判 ...
2026-01-14在数字化时代,用户的每一次操作——无论是电商平台的“浏览-加购-下单”、APP的“登录-点击-留存”,还是金融产品的“注册-实名 ...
2026-01-13在数据驱动决策的时代,“数据质量决定分析价值”已成为行业共识。数据库、日志系统、第三方平台等渠道采集的原始数据,往往存在 ...
2026-01-13