解决Python中由于logging模块误用导致的内存泄露 首先介绍下怎么发现的吧, 线上的项目日志是通过 logging 模块打到 syslog 里, 跑了一段时间后发现 syslog 的 UDP 连接超过了 8W, 没错是 8 W. 主要是 logging ...
2018-04-10大数据杀熟只是开始,未来算法还将成为法律 1,最近看到网上流传着大量滴滴打车,面对不同用户不同价格的截图,并在互联网上引发了大量的抨击,认为滴滴的这种价格歧视是损害消费者的行为。 同样类似的事情 ...
2018-04-10
分析了2.2W条抖音数据,发现95后其实很养生 或许是因为抖音的推荐算法,那些火爆的视频会优先推荐给我们,导致其更加火,而那些普通的几百赞视频,则默默的扎堆在一起,被系统遗弃。 文 / 张佳 来 ...
2018-04-09
论炒币者的自我修养 加密货币,这个词本身就充满了密码学的神秘感。 对一个新手而言,要学习如何炒币可能很困难。不过,当前众多的行业专家和在线资源十分便利,通过一些高质量的新媒体资讯平台,比如币圈 ...
2018-04-09【北京抱财金融信息服务有限公司】招聘数据分析师 中联达是一家以“实业+金融”双轮驱动的集团公司,业务涵盖医疗和互联网金融两个领域。其中医疗领域以北京联达动力信息科技股份有限公司领衔,公司已于2015年成功 ...
2018-04-09【广州市微帝电子商务有限公司】招聘数据分析师 广州市微帝电子商务有限公司,以全新的理念和运作模式立足广东、辐射全国各地。“实体+移动端+互联网=专业化的合作”,公司现设五大中心——运营中心、新媒体中心、行 ...
2018-04-09【上海匹匹扣网络科技有限公司】招聘数据分析师 上海匹匹扣网络科技有限公司,成立于2013年,基于专业的创始团队及强大的互联网基因创立旅游圈——旅游互联网品牌。北京匹匹扣国际旅行社有限公司,是上海匹匹扣网络 ...
2018-04-09
区块网,什么是区块链技术?什么叫区块链 区块链是一种分布式共享记账的技术,它要做的事情就是让参与的各方能够在技术层面建立信任关系。 区块链可以大致分成两个层面,一是做区块链底层技术;二是做区块链 ...
2018-04-09
Python变量赋值的秘密分享 在Python中,我们令一个变量等于另外一个变量时,并不是把值传递给它,而是直接把指向的地址更改了。我们想要查看一个变量在内存中的地址,可以通过id(变量) 来查看。我们通过一个小 ...
2018-04-09
Python图形绘制操作之正弦曲线实现方法分析 这篇文章主要介绍了Python图形绘制操作之正弦曲线实现方法,涉及Python使用numpy模块数值运算及matplotlib.pyplot模块进行图形绘制的相关操作技巧,需要的朋友可以参考 ...
2018-04-09
大数据会说话,简明机器学习问题 从数据中学习究竟是什么?科学家从数据中学习,企业、政府和慈善机构也一样。事实上,无论是私人、公共的,还是慈善部门的领域,几乎没有哪个领域不在部署数据驱动的模型,以发 ...
2018-04-09
大数据如何帮助我们改善大气环境 大数据可以把现有的旧能源网络变成更加智能的网络,能够了解个人的能源消耗状况。这无疑将提高效率,降低能源价格并帮助我们减少碳排放量。 智能能源网格 在不久的将来,将 ...
2018-04-09机器学习中的非均衡分类问题 非均衡分类问题是指在分类器训练时,正例数目和反例数目不相等(相差很大),或者错分正反例导致的代价不同(可从代价矩阵观测)时存在的问题。 而大多数情况下,不同类别的分类 ...
2018-04-09
如何解决分类中的样本倾斜问题 先来说说样本的偏斜问题,也叫数据集偏斜(unbalanced),它指的是参与分类的两个类别(也可以指多个类别)样本数量差异很大。比如说正类有10,000个样本,而负类只给了10 ...
2018-04-09云计算,大数据,人工智能为何总是捆绑出现 在谈到创新型前沿科技的时候,我们会发现一个有趣的现象,\"云计算、大数据、人工智能\"这三个概念经常是\"捆绑式\"出现,它们之间好像有什么紧密的关联,在谈到云 ...
2018-04-09大数据驱动国家治理的未来图景 大数据是信息化发展的新阶段。大数据是一种创新技术、一种基础设施、一种生产要素、一种战略资源、一种科技产业,也是一种治理技术。随着互联网技术的迅猛发展,大数据已经成为了 ...
2018-04-09【北京康普森生物技术有限公司】招聘数据分析师 北京康普森生物技术有限公司(以下简称“康普森生物”)是中关村生命科学园内的国家级高新技术企业,公司自2011年注册成立以来一直致力于为生命科学、动植物分子育种 ...
2018-04-08【义米能源科技(上海)有限公司】招聘数据分析师 义米能源科技(上海)有限公司,属于上海盛海石油化工有限公司旗下公司。义米能源希望通过自身的不断创新,采用先进的技术,整合线下资源和线上资源,改变物流企业传 ...
2018-04-08【上海极高信息技术有限公司】招聘数据分析师 上海极高信息技术有限公司以互联网技术为核心,第三方电商平台及自研跨境移动电商平台为基础,依托互联网社交分享营销理念,专注于跨境出口零售的垂直类电子商务平台业 ...
2018-04-08
区块链数据的价值体现方式 很多人在提到大数据的时候,都会提到这样一个观点:数据即价值。宏观的来看这个论点,没什么问题。然而,我们如果回溯一下这个观点的论证过程,就会发现一些有意思的事情。 信息本 ...
2018-04-08在实证研究中,层次回归分析是探究“不同变量组对因变量的增量解释力”的核心方法——通过分步骤引入自变量(如先引入人口统计学 ...
2025-11-13在实时数据分析、实时业务监控等场景中,“数据新鲜度”直接决定业务价值——当电商平台需要实时统计秒杀订单量、金融系统需要实 ...
2025-11-13在数据量爆炸式增长的今天,企业对数据分析的需求已从“有没有”升级为“好不好”——不少团队陷入“数据堆砌却无洞察”“分析结 ...
2025-11-13在主成分分析(PCA)、因子分析等降维方法中,“成分得分系数矩阵” 与 “载荷矩阵” 是两个高频出现但极易混淆的核心矩阵 —— ...
2025-11-12大数据早已不是单纯的技术概念,而是渗透各行业的核心生产力。但同样是拥抱大数据,零售企业的推荐系统、制造企业的设备维护、金 ...
2025-11-12在数据驱动的时代,“数据分析” 已成为企业决策的核心支撑,但很多人对其认知仍停留在 “用 Excel 做报表”“写 SQL 查数据” ...
2025-11-12金融统计不是单纯的 “数据计算”,而是贯穿金融业务全流程的 “风险量化工具”—— 从信贷审批中的客户风险评估,到投资组合的 ...
2025-11-11这个问题很有实战价值,mtcars 数据集是多元线性回归的经典案例,通过它能清晰展现 “多变量影响分析” 的核心逻辑。核心结论是 ...
2025-11-11在数据驱动成为企业核心竞争力的今天,“不知道要什么数据”“分析结果用不上” 是企业的普遍困境 —— 业务部门说 “要提升销量 ...
2025-11-11在大模型(如 Transformer、CNN、多层感知机)的结构设计中,“每层神经元个数” 是决定模型性能与效率的关键参数 —— 个数过少 ...
2025-11-10形成购买决策的四个核心推动力的是:内在需求驱动、产品价值感知、社会环境影响、场景便捷性—— 它们从 “为什么买”“值得买吗 ...
2025-11-10在数字经济时代,“数字化转型” 已从企业的 “可选动作” 变为 “生存必需”。然而,多数企业的转型仍停留在 “上线系统、收集 ...
2025-11-10在数据分析与建模中,“显性特征”(如用户年龄、订单金额、商品类别)是直接可获取的基础数据,但真正驱动业务突破的往往是 “ ...
2025-11-07在大模型(LLM)商业化落地过程中,“结果稳定性” 是比 “单次输出质量” 更关键的指标 —— 对客服对话而言,相同问题需给出一 ...
2025-11-07在数据驱动与合规监管双重压力下,企业数据安全已从 “技术防护” 升级为 “战略刚需”—— 既要应对《个人信息保护法》《数据安 ...
2025-11-07在机器学习领域,“分类模型” 是解决 “类别预测” 问题的核心工具 —— 从 “垃圾邮件识别(是 / 否)” 到 “疾病诊断(良性 ...
2025-11-06在数据分析中,面对 “性别与购物偏好”“年龄段与消费频次”“职业与 APP 使用习惯” 这类成对的分类变量,我们常常需要回答: ...
2025-11-06在 CDA(Certified Data Analyst)数据分析师的工作中,“可解释性建模” 与 “业务规则提取” 是核心需求 —— 例如 “预测用户 ...
2025-11-06在分类变量关联分析中(如 “吸烟与肺癌的关系”“性别与疾病发病率的关联”),卡方检验 P 值与 OR 值(比值比,Odds Ratio)是 ...
2025-11-05CDA 数据分析师的核心价值,不在于复杂的模型公式,而在于将数据转化为可落地的商业行动。脱离业务场景的分析只是 “纸上谈兵” ...
2025-11-05