京公网安备 11010802034615号
经营许可证编号:京B2-20210330
党的十八届五中全会把握大数据迅猛发展的趋势,提出“实施国家大数据战略,推进数据资源开放共享”。毫无疑问,国家大数据战略的实施为社会科学研究打开了“另一扇窗子”。但是,目前社会科学领域对大数据的运用还存在一定分歧:支持者认为大数据将显著提升社科研究能力和水平;反对者则担忧大数据的运用会削弱社科研究中的伦理、价值等基本要素,可能带来社科研究基本学术精神的蜕变。实际上,只要我们把握社科研究的本质和使命,明确大数据的基本特征和发展走向,就能认清大数据运用给社科研究带来的新变化,改变“望数兴叹”的状况。
其实,利用大数据进行社科研究,并不能算是一种颠覆,反而可以说是一种传承。现代社会科学是近代西方自然科学复兴和科技革命推动的产物,在形成发展过程中不可避免地融入了结构、功能、规律等自然科学研究范畴,形成了实证主义与自然主义相交融、定性研究与定量研究相辉映的社科研究多重范式体系。大数据方法的运用可以为社科研究提供一种新的叙事方式和诠释手法,能够传承社科研究内含的自然科学研究范式,更好地用数据描摹过去难以刻画的抽象概念和知识本体,提供一种综合定性研究与定量研究的可行途径,提供一种无需预设理论假定而从数据集中抽象和发现规律的研究方法。展望未来,在社科研究中运用好大数据,不但可以提高社科研究者的研究能力,还能开启社科研究新局面。
提高社科研究能力。社科研究的目的是服务社会发展。当前,社科研究的数据环境发生了很大变化,政府、企业和研究机构越来越多的数据对社会开放,大量的数字化资料和研究素材极大降低了数据的获取成本,并且数据充裕带来了研究机遇的质变,以往不可研究、不能研究的问题成为研究可能。但是,面对零散、原始、复杂、巨量、多样、多变的碎片化数据缺乏必要的分析技术,大尺度研究中的数据源离散且阻隔,导致许多社科研究者缺乏相应的研究能力,不得不“望数兴叹”。大数据技术的发展和运用,可以弥补社科研究者在数据运用方面的短板,能够有效提高学者们的研究能力。
开启社科研究新局。大数据的运用有助于形成社科研究新思维,进一步推动研究数据有序开放、跨学科深度协作以及社会科学与自然科学技术融合,从而开启社科研究新局面。
第一,实现研究全程评价和全部研究数据资产化。科学研究生成的文献、转换与加工数据、原始数据呈金字塔状分布,处于下层的数据一般难以得到有效评价和利用,是“看不见的学术金矿”。而数据资源化、研究素材数字化使得全周期和多维度的社科研究评价成为可能,进而衍生出新的学术资源利用机制,可以使全部研究数据都成为学术资产。
第二,实现研究资料的碎片化重组。以往社科研究数据多采用结构化资料,有预设前提,应用面窄。而片段数据的碎片化按需重组,可以快捷有效地应对研究过程中的突发问题,同时兼顾研究效果与效率。
第三,实现计算化分析与可视化表现的结合。非计算化的传统社科研究以问题为导向,基本逻辑关系是迭代思维,需要基于已知的研究观点提出新观点,而计算化分析更多采取融合、仿真或推演的方式。可视化技术则将计算化结果简明地呈现出来,能够增强社科研究的可理解性与可阅读性。
第四,进一步推动学科融合与数据服务发展。面对学科交叉创新、协同创新的大量涌现,传统研究模式已难以适应,客观上要求计算科学与社会科学紧密协作,推动学科之间向网状交叉与紧密融合方向纵深发展,进而推动学科知识体系网络化。
大数据的运用还将进一步推动学术技术分析服务、数据服务的发展。传统承担文献资料服务和普通信息服务的图书馆、情报服务机构等将向数据委托服务、计算分析服务转型。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在分类变量关联分析中(如 “吸烟与肺癌的关系”“性别与疾病发病率的关联”),卡方检验 P 值与 OR 值(比值比,Odds Ratio)是 ...
2025-11-05CDA 数据分析师的核心价值,不在于复杂的模型公式,而在于将数据转化为可落地的商业行动。脱离业务场景的分析只是 “纸上谈兵” ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-04【2025最新版】CDA考试教材:CDA教材一级:商业数据分析(2025)__商业数据分析_cda教材_考试教材 (cdaglobal.com) ...
2025-11-04在数字化时代,数据挖掘不再是实验室里的技术探索,而是驱动商业决策的核心能力 —— 它能从海量数据中挖掘出 “降低成本、提升 ...
2025-11-04在 DDPM(Denoising Diffusion Probabilistic Models)训练过程中,开发者最常困惑的问题莫过于:“我的模型 loss 降到多少才算 ...
2025-11-04在 CDA(Certified Data Analyst)数据分析师的工作中,“无监督样本分组” 是高频需求 —— 例如 “将用户按行为特征分为高价值 ...
2025-11-04当沃尔玛数据分析师首次发现 “啤酒与尿布” 的高频共现规律时,他们揭开了数据挖掘最迷人的面纱 —— 那些隐藏在消费行为背后 ...
2025-11-03这个问题精准切中了配对样本统计检验的核心差异点,理解二者区别是避免统计方法误用的关键。核心结论是:stats.ttest_rel(配对 ...
2025-11-03在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次 ...
2025-11-03在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29