京公网安备 11010802034615号
经营许可证编号:京B2-20210330
2012年11月30日于北京开幕的HBTC 2012 (Hadoop与大数据技术大会 2012,原 Hadoop in China) 技术盛会上,云集众多学者、企业用户以及技术领袖。大会发扬开源精神的角度,联合国际和国内 Hadoop 及大数据应用的产学界人士和成功企业,通过技术应用审视大数据技术生态系统的现状和发展趋势,围绕大数据处理、信息检索、内容挖掘、自然语言理解、数据可视化、计算广告学、地理信息系统等相关技术主题进行探讨,充分促进 Hadoop 与大数据技术在国内的应用实践。
Etu 知意图首席顾问陈昭宇先生,在本届大会上进行了题为”企业应用Hadoop 的最佳模式”的主题演讲。在演讲中,陈昭宇先生不仅介绍了知意图大数据一体机 Etu Appliance 2.0 版本的最新功能,同时也向与会嘉宾分享知意图的用户和伙伴基于 Etu Appliance 2.0 上开发的行业解决方案与应用案例,让更多对大数据感兴趣但充满疑虑的人,充分了解大数据如何真正的落地。
Etu 知意图是亚洲大数据解决方案的领导品牌,专注于电信、金融、与电商行业的大数据解决方案研发,于 2012 年3 月28 日正式发布了亚洲第一个基于Hadoop 的大数据一体机产品 —— Etu Appliance。在此次 HBTC 2012 年度盛会中,Etu 知意图再次与现场的嘉宾分享了技术卓越的 Hadoop 大数据一体机产品Etu Appliance 的最新版本。这一版本在 Hadoop 生态系统的开源基础上,除了计算效能是用户自行搭建系统的3~12倍外,还实现了一键式的大规模集群自动部署、非仅是Name Node的系统全面性 HA、Kerberos/LDAP集成的多租户安全性、高效数据采集、集群集中管理等特色功能,是一个真正企业级即插即用的 Hadoop 一体机产品。
“因为Etu 知意图深刻理解 Hadoop 应用开发者与系统管理员的痛,我们独到的设计让Etu Appliance 2.0 确实做到了 Hadoop集群部署、管理、HA、安全性都简单难以超越,计算与网络传输效能高性价。这是亚洲的骄傲,并首先在中国发布。”Etu 知意图负责人蒋居裕在 HBTC 2012 大会上如此表示。
来自 Etu 知意图的大数据系统架构专家施宏良 (Jason Shih) 先生,也和与会嘉宾一起做了“从 Hadoop 安全架构部署实施到高等服务的演变”的精彩分享,施宏良先生认为目前使用 Hadoop 的开源框架,组织和管理庞大的数据量已经成为解决快速数据处理和提高分析能力的趋势。但企业对于数据与集群系统的安全有更高的要求,从不同层面或者访问权限上分离敏感信息和隔离共享存储或计算机设备。在 Hadoop 0.20 之前的版本中,类似 Unix 的文件权限已经提及并提供集群内的简单身份验证机制,但缺乏访问控制每个作业队列,控制提交等操作。为了使用新的安全功能,Etu Appliance 2.0集成了 Kerberos 网络认证协议,使其具备强大的身份验证和授权,保证严格的访问控制数据,资源和隔离之间运行的任务。施宏良先生分享了基于 Kerberos 的 Hadoop 安全集群环境的基础设施部署细节以及如何以此实现高层次的服务。通过 Etu Appliance 的快速部署和自动化系统内置的跨域认证机制,实现现有的活动域与外部 LDAP 域的互操作,并有效减少集成和操作的管理员开销。
2012 年5 月,Etu 知意图正式在北京发布了基于Hadoop 的Etu Appliance 知意图大数据一体机。同年10 月,又针对电子商务的行业特征推出具有针对性的解决方案知意图精准推荐系统 Etu Recommender。标志着Etu 知意图以Etu Appliance 知意图大数据一体机为数据处理平台为基础,支撑多种行业应用的“一横多纵”产品走向初步建立。
大数据起源于互联网,因而使用大数据的人才大多也扎根互联网。为了改善“人才瓶颈就是技术瓶颈”的现状,Etu 知意图为了更好的帮助中国用户实现 Hadoop 大数据处理与分析价值,特别在北京建立了 Hadoop 开发原厂团队和技术支持团队,Etu 知意图大数据一体机降低 Hadoop 采用上的系统门槛,帮助企业跨越大数据处理基础架构的障碍。Etu 知意图清楚的知道 Hadoop 等技术是实现大数据的技术手段,让企业发现数据背后的价值,集中精力透过数据寻找新的商业机会上才是大数据的核心意义。(文章来源:CDA数据分析师)
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】软件、洞察力、大数据、产品、经验、硬件、流量、创新、决策、数据安全、网络安全、数据分析、决策制定、数据挖 ...
2026-06-18在方案选型、效果复盘、产品评估、供应商筛选等各类业务决策场景中,仅凭单一指标下结论往往会陷入 “以偏概全” 的误区。多维度 ...
2026-06-18 很多数据分析师精通Excel单元格操作,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质区别”“为什么表结 ...
2026-06-18在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-06-17【核心关键词】数据库、电商、知识、产品、数据产品、监管业务、产品经理、业务系统、用户行为分析、用户分析、数据分析、电商 ...
2026-06-16在 Python 动态类型与面向对象的编程体系中,变量定义与类实例化是构建代码逻辑的两大核心基石。变量是数据存储、传递与运算的基 ...
2026-06-16 很多数据分析师每天与Excel打交道,但当被问到“表格结构数据和表结构数据有什么区别”“数据类型误判会引发哪些分析错误” ...
2026-06-16在 MySQL 查询性能优化体系中,索引是降低查询耗时、提升数据库吞吐的核心手段。其中联合索引与覆盖索引是实际开发中最高频的两 ...
2026-06-15在数据仓库建设与商业智能分析体系中,维度建模是应用最广泛的建模方法论,而事实表与维度表是维度建模的两大核心构件,共同构成 ...
2026-06-15 很多数据分析师能熟练计算指标,但当被问到“这家企业的核心业务目标是什么”“如何把模糊的战略目标拆解为可量化的指标”“ ...
2026-06-15在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10