京公网安备 11010802034615号
经营许可证编号:京B2-20210330
2012年11月30日于北京开幕的HBTC 2012 (Hadoop与大数据技术大会 2012,原 Hadoop in China) 技术盛会上,云集众多学者、企业用户以及技术领袖。大会发扬开源精神的角度,联合国际和国内 Hadoop 及大数据应用的产学界人士和成功企业,通过技术应用审视大数据技术生态系统的现状和发展趋势,围绕大数据处理、信息检索、内容挖掘、自然语言理解、数据可视化、计算广告学、地理信息系统等相关技术主题进行探讨,充分促进 Hadoop 与大数据技术在国内的应用实践。
Etu 知意图首席顾问陈昭宇先生,在本届大会上进行了题为”企业应用Hadoop 的最佳模式”的主题演讲。在演讲中,陈昭宇先生不仅介绍了知意图大数据一体机 Etu Appliance 2.0 版本的最新功能,同时也向与会嘉宾分享知意图的用户和伙伴基于 Etu Appliance 2.0 上开发的行业解决方案与应用案例,让更多对大数据感兴趣但充满疑虑的人,充分了解大数据如何真正的落地。
Etu 知意图是亚洲大数据解决方案的领导品牌,专注于电信、金融、与电商行业的大数据解决方案研发,于 2012 年3 月28 日正式发布了亚洲第一个基于Hadoop 的大数据一体机产品 —— Etu Appliance。在此次 HBTC 2012 年度盛会中,Etu 知意图再次与现场的嘉宾分享了技术卓越的 Hadoop 大数据一体机产品Etu Appliance 的最新版本。这一版本在 Hadoop 生态系统的开源基础上,除了计算效能是用户自行搭建系统的3~12倍外,还实现了一键式的大规模集群自动部署、非仅是Name Node的系统全面性 HA、Kerberos/LDAP集成的多租户安全性、高效数据采集、集群集中管理等特色功能,是一个真正企业级即插即用的 Hadoop 一体机产品。
“因为Etu 知意图深刻理解 Hadoop 应用开发者与系统管理员的痛,我们独到的设计让Etu Appliance 2.0 确实做到了 Hadoop集群部署、管理、HA、安全性都简单难以超越,计算与网络传输效能高性价。这是亚洲的骄傲,并首先在中国发布。”Etu 知意图负责人蒋居裕在 HBTC 2012 大会上如此表示。
来自 Etu 知意图的大数据系统架构专家施宏良 (Jason Shih) 先生,也和与会嘉宾一起做了“从 Hadoop 安全架构部署实施到高等服务的演变”的精彩分享,施宏良先生认为目前使用 Hadoop 的开源框架,组织和管理庞大的数据量已经成为解决快速数据处理和提高分析能力的趋势。但企业对于数据与集群系统的安全有更高的要求,从不同层面或者访问权限上分离敏感信息和隔离共享存储或计算机设备。在 Hadoop 0.20 之前的版本中,类似 Unix 的文件权限已经提及并提供集群内的简单身份验证机制,但缺乏访问控制每个作业队列,控制提交等操作。为了使用新的安全功能,Etu Appliance 2.0集成了 Kerberos 网络认证协议,使其具备强大的身份验证和授权,保证严格的访问控制数据,资源和隔离之间运行的任务。施宏良先生分享了基于 Kerberos 的 Hadoop 安全集群环境的基础设施部署细节以及如何以此实现高层次的服务。通过 Etu Appliance 的快速部署和自动化系统内置的跨域认证机制,实现现有的活动域与外部 LDAP 域的互操作,并有效减少集成和操作的管理员开销。
2012 年5 月,Etu 知意图正式在北京发布了基于Hadoop 的Etu Appliance 知意图大数据一体机。同年10 月,又针对电子商务的行业特征推出具有针对性的解决方案知意图精准推荐系统 Etu Recommender。标志着Etu 知意图以Etu Appliance 知意图大数据一体机为数据处理平台为基础,支撑多种行业应用的“一横多纵”产品走向初步建立。
大数据起源于互联网,因而使用大数据的人才大多也扎根互联网。为了改善“人才瓶颈就是技术瓶颈”的现状,Etu 知意图为了更好的帮助中国用户实现 Hadoop 大数据处理与分析价值,特别在北京建立了 Hadoop 开发原厂团队和技术支持团队,Etu 知意图大数据一体机降低 Hadoop 采用上的系统门槛,帮助企业跨越大数据处理基础架构的障碍。Etu 知意图清楚的知道 Hadoop 等技术是实现大数据的技术手段,让企业发现数据背后的价值,集中精力透过数据寻找新的商业机会上才是大数据的核心意义。(文章来源:CDA数据分析师)
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27