京公网安备 11010802034615号
经营许可证编号:京B2-20210330
城市科学大数据与社会物理学如何变革城市的发展_数据分析师培训
共享体验模式与社会纽带模式服从相同的一般规则。对社会网络中的每个人而言都是全新体验的最大的可能性,发生在人们最不常去的地方。去远处探索新想法是最有成效的,日常生活的普通体验则通过在本地社区的参与被升华为社会规范。
托马斯·杰斐逊(Thomas Jefferson)对18世纪的城市有一个著名的描述:“人性堕落的大阴沟。”但是,自杰斐逊时代以来,世界上的城市已经成百倍地增长,而且这种增长并无减弱的趋势。现在,居住在城市中的人口比例是有史以来最高的。既然城市有高昂的生活费用和比生活费用更高的犯罪率、污染程度以及传染病威胁,人们为什么还会持续不断地迁往城市?也许正如亚当·斯密所言:“城市中心既特别堕落又特别创新。”
尽管有关城市的研究已经持续了一个多世纪,我们对于为什么城市能促进创新依然缺乏一个有说服力的模型。城市确实有创新:相比于农村地区,城市更为有效地使用资源,产生更多的专利和发明,人均使用道路和服务更少。是否可以让更多人居住在一起以获得更有效的想法创新和更高的生产率?一些学者指出了技术扩散在创造智力资本中的作用,另一些人则阐述了层次化社会结构和专业化的作用。
专注于想法流而不是商品流
正如前面章节讨论的那样,社会网络互动和想法流是团队和企业里创意产出和生产率的主要推动力。这些社会物理学的概念在社会科学中几乎是仅有的可扩展的概念,并且正如本章要介绍的那样,这些概念完全可以超越小的团队和企业,扩展到城市层面,并通过这些大得多的社会网络促成更高的生产率和更大的创造力。城市和公司一样都是想法机器。
我和潘巍、格拉·戈沙尔 (Gourab Ghoshal)、科科·克鲁姆(CocoKrumme)以及曼纽尔·塞布里安(ManuelCebrian)等学生和同事一起建立了一个数学模型,它基于在面对面距离内的人数来阐述社会纽带如何推动城市里的想法流。正如我们在《自然通讯》(NatureCommunications)的一篇文章中描述的那样,这是一个定量预测GDP和创意产出的简单、自下而上、鲁棒的模型。我们也已经能够说明,沿着社会纽带的想法流可以准确再现城市特征,包括艾滋病毒感染率、电话通信模式、犯罪率和专利权率,等等。它也为我们提供了设计更具创意和效率的城市,尽可能减少犯罪和其他负面因素的研究成果。
值得注意的是,这种从社会物理学的角度看待城市的方法是与传统的阶层和专业化模型不同的。前者专注的是想法流,而不是后者描述的社会的静态分割。这样看来,社会物理学类似于用工厂之间的距离和运输物品的成本等来解释城市制造业有效性的模型。而它们的不同之处在于:社会物理学把城市和公司定位为想法工厂,因此专注于想法的流动而不是物品的流动。
从这个观点看,社会物理学与社会学、地理学和探讨人口密度与创新之间关系的经济学,以及沿着社会纽带进行的传播和创造力研究是一脉相承的。社会物理学新的重要贡献在于把这些想法集成到单一数学模型中,并可用稠密、连续的行为数据以及能够获得的经济和社会结果数据来进行检验。社会纽带和想法流在人类互动模式、移动模式和城市经济特征之间提供了简单的生成链接,无需借助层次化、专业化或类似的社会结构概念。正如本章后续部分要阐述的那样,真
正重要的是想法的流动,而不是阶层或市场。
城市中的社会纽带模式
城市中社会纽带的模式可以通过如下概念描述:两个人之间产生关系的可能性是由“中介机会”(intervening opportunities)的数量决定的。其核心思想很简单:如果你在某群人中有许多“可能认识的人”,那么你与其中某个陌生人建立友谊的可能性就比较小。大卫·利本诺尔(David LibeNowell)及其同事研究了一个日记网站的成员并绘制了他们与朋友和熟人居住距离的信息。他们发现,对于大多数朋友而言,两个人形成社会纽带的可能性与在这两人之间的地点上逗留的人数成反比。
在一个基于位置的社会网络应用Gowalla中发现了类似的关系,Gowalla记录个人及其朋友“签到”的地点。研究人员使用这些数据可以知道朋友之间居住距离的远近,以及朋友们去同一个地点的频率。这一研究得到了一个简单的数学方程,它描述了人们往往会和住在附近的人有较多的社会纽带,并且随着距离的增加,纽带的数量也越来越少。
然而,这一关于社会纽带的数学关系还有其他更为有趣的应用。例如,艾滋病这类疾病的传播显然依赖社会纽带的分布,打电话模式也是如此(当然依赖方式非常不同)。打电话模式作为区县人口的函数和艾滋病的感染率作为每平方英里人口密度的函数,这是两种非常不同的现象。然而,两者都可以用通过分析网站与社会网络所测量的距离与社会纽带数量之间相同的数学关系来预测。
城市中所有的社会纽带模式都能在更小规模的团队结构中找到对应。正如在我们关于公司的研究(第4章和第5章)中所看到的那样,亲密的社会纽带对参与有支持作用,因为这些人更有可能互相交谈,从而进一步把想法转变为行动。远距离的社会纽带则起着探索的作用,因为我们在新环境中遇见“新人”,并从他们那里收获新想法。
然而在公司里,在工作团队和“其他人”之间通常有着明确的边界。工作之外,在我们与其他人互动的整个模式中,探索和参与之间通常并没有明确的边界。也就是说,当我们考察所有的互动时,可以看到人们具有多个社会角色(例如母亲、同事、公民、爵士乐爱好者等),并且每个角色涉及不同的人群,因此,在个人社会网络中,参与和探索的功能是结合在一起的。
探索越多,城市越富足
前面的章节介绍了我的研究小组利用从手机、社会网络和社会计量标牌等大数据源采集的数据所做的研究。观察人类行为的另一个大数据透镜是信用卡数据。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,每一位用户与产品的交互都会留下可追溯的行为轨迹——电商用户的浏览、加购、下单,APP用户的注册、登录、功能使 ...
2026-03-31在日常数据统计、市场调研、学术分析等场景中,我们常常需要判断两个分类变量之间是否存在关联(如性别与消费偏好、产品类型与满 ...
2026-03-31在CDA(Certified Data Analyst)数据分析师的职场实战与认证考核中,“可解释性建模”是核心需求之一——企业决策中,不仅需要 ...
2026-03-31多层感知机(MLP,Multilayer Perceptron)作为深度学习中最基础、最经典的神经网络模型,其结构设计直接决定了模型的拟合能力、 ...
2026-03-30在TensorFlow深度学习实战中,数据集的加载与预处理是基础且关键的第一步。手动下载、解压、解析数据集不仅耗时费力,还容易出现 ...
2026-03-30在CDA(Certified Data Analyst)数据分析师的日常工作中,“无监督分组、挖掘数据内在聚类规律”是高频核心需求——电商场景中 ...
2026-03-30机器学习的本质,是让模型通过对数据的学习,自主挖掘规律、实现预测与决策,而这一过程的核心驱动力,并非单一参数的独立作用, ...
2026-03-27在SQL Server数据库操作中,日期时间处理是高频核心需求——无论是报表统计中的日期格式化、数据筛选时的日期类型匹配,还是业务 ...
2026-03-27在CDA(Certified Data Analyst)数据分析师的能力体系与职场实操中,高维数据处理是高频且核心的痛点——随着业务场景的复杂化 ...
2026-03-27在机器学习建模与数据分析实战中,特征维度爆炸、冗余信息干扰、模型泛化能力差是高频痛点。面对用户画像、企业经营、医疗检测、 ...
2026-03-26在这个数据无处不在的时代,数据分析能力已不再是数据从业者的专属技能,而是成为了职场人、管理者、创业者乃至个人发展的核心竞 ...
2026-03-26在CDA(Certified Data Analyst)数据分析师的能力体系中,线性回归是连接描述性统计与预测性分析的关键桥梁,也是CDA二级认证的 ...
2026-03-26在数据分析、市场研究、用户画像构建、学术研究等场景中,我们常常会遇到多维度、多指标的数据难题:比如调研用户消费行为时,收 ...
2026-03-25在流量红利见顶、获客成本持续攀升的当下,营销正从“广撒网”的经验主义,转向“精耕细作”的数据驱动主义。数据不再是营销的辅 ...
2026-03-25在CDA(Certified Data Analyst)数据分析师的全流程工作中,无论是前期的数据探索、影响因素排查,还是中期的特征筛选、模型搭 ...
2026-03-25在当下数据驱动决策的职场环境中,A/B测试早已成为互联网产品、运营、营销乃至产品迭代优化的核心手段,小到一个按钮的颜色、文 ...
2026-03-24在统计学数据分析中,尤其是分类数据的分析场景里,卡方检验和显著性检验是两个高频出现的概念,很多初学者甚至有一定统计基础的 ...
2026-03-24在CDA(Certified Data Analyst)数据分析师的日常业务分析与统计建模工作中,多组数据差异对比是高频且核心的分析场景。比如验 ...
2026-03-24日常用Excel做数据管理、台账维护、报表整理时,添加备注列是高频操作——用来标注异常、说明业务背景、记录处理进度、补充关键 ...
2026-03-23作为业内主流的自助式数据可视化工具,Tableau凭借拖拽式操作、强大的数据联动能力、灵活的仪表板搭建,成为数据分析师、业务人 ...
2026-03-23