python脚本实现分析dns日志并对受访域名排行 前段时间有个需求是要求查一段时间的dns上的域名访问次数排行(top100),没办法,只好慢慢的去解析dns日志呗,正好学习了python,拿来练练手。 1.原始数据分 ...
2018-02-05改善企业数据管理流程七个建议 为了对信息进行更好的监督和管理,从而改善业务运营效率,许多企业都开始投资数据治理项目。其策略和流程设计用来在整个企业中产生更为精确和一致的数据,数据专员(Data Steward ...
2018-02-05大数据一统天下 窃听何时休 互联网和智能通讯技术的应用和普及,加速了经济全球化的进程,拓宽了全球资讯传播分享界域,也增强了世界各国民众间的交流和互动。但是,从斯诺登事件的持续发酵和美国安局对全球网 ...
2018-02-05python中的set实现不重复的排序原理 最近在尝试写选课系统的时候遇到一个问题: 1、存在两个类 School、Teacher ; 2、School实例中包含多个Teacher的实例,但又不可重复 本人想到在School中用set( ...
2018-02-05Python中set与frozenset方法和区别详解 set(可变集合)与frozenset(不可变集合)的区别: set无序排序且不重复,是可变的,有add(),remove()等方法。既然是可变的,所以它不存在哈希值。基本功能包括关系 ...
2018-02-05大数据分析模式 折射出背后隐患 随着大数据的发展,大数据分析也已经应用到各个领域,大数据分析主要有三种类型,而这三种类型的背后也隐藏着不为人知的隐患,这些隐患是不容忽视的,亟需要彻底解决。 ...
2018-02-05Python中内置数据类型list,tuple,dict,set的区别和用法 Python语言简洁明了,可以用较少的代码实现同样的功能。这其中Python的四个内置数据类型功不可没,他们即是list, tuple, dict, set。这里对他们进行一个 ...
2018-02-05大数据与隐私安全并非矛盾体 大数据的发展,带来的社会价值和商业价值是不言而喻的,因此同时,隐私安全问题也为很多人所诟病,然而大数据与隐私安全真的是一对矛盾统一体吗?其实并非如此,这两者是完全可以兼 ...
2018-02-05python实现将元祖转换成数组的方法 本文实例讲述了python实现将元祖转换成数组的方法。分享给大家供大家参考。具体分析如下: python的元祖使用一对小括号表示的,元素是固定的,如果希望添加新的元素, ...
2018-02-05中国大数据市场和技术发展趋势 为了准确描述中国大数据市场和技术发展趋势,解析大数据发展的各阶段对IT技术的需求,2013年6月,中桥国际调研咨询(以下简称中桥)对中国480家最终用户的IT管理者和专业人员,就 ...
2018-02-05使用Python判断质数(素数)的简单方法讲解 质数又称素数。指在一个大于1的自然数中,除了1和此整数自身外,不能被其他自然数整除的数。素数在数论中有着很重要的地位。比1大但不是素数的数称为合数。1和0既非素 ...
2018-02-05大数据可否被神化 大数据的发展速度让人瞠目结舌,大数据应用的快速深入也引起业界广泛关注,如今,大数据总量的增长主要归功于非结构化数据的增长。 广义的非结构化数据也包括了半结构化和多结构化数据,目前 ...
2018-02-05【便利蜂商贸有限公司】招聘数据分析师 北京梦想蜂连锁商业有限公司是一家以科技创新为先导、以安全健康为核心、以便民高效为目标的创新创业企业,公司以“便利蜂”为品牌名称,于2016年12月在北京完成注册申请,注 ...
2018-02-04【蓝色光标-欧泰谱】招聘数据分析师 欧泰谱(http://www.otype.cn/)是蓝色光标全资CRM子公司,基于行业理解及消费者洞察,结合技术和数据发展趋势,专注为品牌主提供CRM营销服务。蓝色光标传播集团是一家为大型企业 ...
2018-02-04【上海步成教育科技有限公司】招聘数据分析师 上海步成教育科技有限公司注册于华东师范大学科技园,总部位于华东师范大学校内。上海步成教育科技有限公司是新型的高科技企业,是我国著名心理测量专家、华东师范大学 ...
2018-02-04本文实例分析了python动态性强类型用法。分享给大家供大家参考。具体如下: Python变量声明和定义 与C#不同,Python在使用变量之前无须定义它的类型,试着运行下面的例子: i = 12 print i python动态性强类型 ...
2018-02-04python+pillow绘制矩阵盖尔圆简单实例 本文主要研究的是使用Python+pillow绘制矩阵盖尔圆的一个实例,具体如下。 盖尔圆是矩阵特征值估计时常用的方法之一,其定义为: 与盖尔圆有关的两个定理为: 定 ...
2018-02-04浅谈插入排序算法在Python程序中的实现及简单改进 这篇文章主要介绍了插入排序算法在Python程序中的实现及简单改进,插入排序算法的最差时间复杂度为O(n^2),最优时间复杂度为O(n),存在一定的优化空间,需要的朋友 ...
2018-02-04大数据驱动创新思维 大数据时代的变革重要的并不是升级现有逻辑,而是需要创造一种新的逻辑。正如外军研究所强调,大数据时代所需要创造的逻辑,关键是需要人们在通常状态下开动左脑的同时,来充分唤醒沉睡的右 ...
2018-02-04python简单的函数定义和用法实例 这篇文章主要介绍了python简单的函数定义和用法,实例分析了Python自定义函数及其使用方法,具有一定参考借鉴价值,需要的朋友可以参考下 具体分析如下: 这里定义了一个温 ...
2018-02-04Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29在标签体系的落地链路中,“设计标签逻辑” 只是第一步,真正让标签从 “纸上定义” 变为 “业务可用资产” 的关键,在于标签加 ...
2025-09-29在使用 Excel 数据透视表进行多维度数据汇总时,折叠功能是梳理数据层级的核心工具 —— 通过点击 “+/-” 符号可展开明细数据或 ...
2025-09-28在使用 Pandas 处理 CSV、TSV 等文本文件时,“引号” 是最容易引发格式混乱的 “隐形杀手”—— 比如字段中包含逗号(如 “北京 ...
2025-09-28在 CDA(Certified Data Analyst)数据分析师的技能工具箱中,数据查询语言(尤其是 SQL)是最基础、也最核心的 “武器”。无论 ...
2025-09-28Cox 模型时间依赖性检验:原理、方法与实战应用 在生存分析领域,Cox 比例风险模型(Cox Proportional Hazards Model)是分析 “ ...
2025-09-26检测因子类型的影响程度大小:评估标准、实战案例与管控策略 在检测分析领域(如环境监测、食品质量检测、工业产品合规性测试) ...
2025-09-26CDA 数据分析师:以数据库为基石,筑牢数据驱动的 “源头防线” 在数据驱动业务的链条中,“数据从哪里来” 是 CDA(Certified D ...
2025-09-26线性相关点分布的四种基本类型:特征、识别与实战应用 在数据分析与统计学中,“线性相关” 是描述两个数值变量间关联趋势的核心 ...
2025-09-25深度神经网络神经元个数确定指南:从原理到实战的科学路径 在深度神经网络(DNN)的设计中,“神经元个数” 是决定模型性能的关 ...
2025-09-25在企业数字化进程中,不少团队陷入 “指标困境”:仪表盘上堆砌着上百个指标,DAU、转化率、营收等数据实时跳动,却无法回答 “ ...
2025-09-25MySQL 服务器内存碎片:成因、检测与内存持续增长的解决策略 在 MySQL 运维中,“内存持续增长” 是常见且隐蔽的性能隐患 —— ...
2025-09-24人工智能重塑工程质量检测:核心应用、技术路径与实践案例 工程质量检测是保障建筑、市政、交通、水利等基础设施安全的 “最后一 ...
2025-09-24CDA 数据分析师:驾驭通用与场景指标,解锁数据驱动的精准路径 在数据驱动业务的实践中,指标是连接数据与决策的核心载体。但并 ...
2025-09-24在数据驱动的业务迭代中,AB 实验系统(负责验证业务优化效果)与业务系统(负责承载用户交互与核心流程)并非独立存在 —— 前 ...
2025-09-23CDA 业务数据分析:6 步闭环,让数据驱动业务落地 在企业数字化转型中,CDA(Certified Data Analyst)数据分析师的核心价值,并 ...
2025-09-23CDA 数据分析师:以指标为钥,解锁数据驱动价值 在数字化转型的浪潮中,“用数据说话” 已成为企业决策的共识。但数据本身是零散 ...
2025-09-23当 “算法” 成为数据科学、人工智能、业务决策领域的高频词时,一种隐形的认知误区正悄然蔓延 —— 有人将分析结果不佳归咎于 ...
2025-09-22在数据分析、金融计算、工程评估等领域,“平均数” 是描述数据集中趋势最常用的工具之一。但多数人提及 “平均数” 时,默认指 ...
2025-09-22