
2012年11月30日于北京开幕的HBTC 2012 (Hadoop与大数据技术大会 2012,原 Hadoop in China) 技术盛会上,云集众多学者、企业用户以及技术领袖。大会发扬开源精神的角度,联合国际和国内 Hadoop 及大数据应用的产学界人士和成功企业,通过技术应用审视大数据技术生态系统的现状和发展趋势,围绕大数据处理、信息检索、内容挖掘、自然语言理解、数据可视化、计算广告学、地理信息系统等相关技术主题进行探讨,充分促进 Hadoop 与大数据技术在国内的应用实践。
Etu 知意图首席顾问陈昭宇先生,在本届大会上进行了题为”企业应用Hadoop 的最佳模式”的主题演讲。在演讲中,陈昭宇先生不仅介绍了知意图大数据一体机 Etu Appliance 2.0 版本的最新功能,同时也向与会嘉宾分享知意图的用户和伙伴基于 Etu Appliance 2.0 上开发的行业解决方案与应用案例,让更多对大数据感兴趣但充满疑虑的人,充分了解大数据如何真正的落地。
Etu 知意图是亚洲大数据解决方案的领导品牌,专注于电信、金融、与电商行业的大数据解决方案研发,于 2012 年3 月28 日正式发布了亚洲第一个基于Hadoop 的大数据一体机产品 —— Etu Appliance。在此次 HBTC 2012 年度盛会中,Etu 知意图再次与现场的嘉宾分享了技术卓越的 Hadoop 大数据一体机产品Etu Appliance 的最新版本。这一版本在 Hadoop 生态系统的开源基础上,除了计算效能是用户自行搭建系统的3~12倍外,还实现了一键式的大规模集群自动部署、非仅是Name Node的系统全面性 HA、Kerberos/LDAP集成的多租户安全性、高效数据采集、集群集中管理等特色功能,是一个真正企业级即插即用的 Hadoop 一体机产品。
“因为Etu 知意图深刻理解 Hadoop 应用开发者与系统管理员的痛,我们独到的设计让Etu Appliance 2.0 确实做到了 Hadoop集群部署、管理、HA、安全性都简单难以超越,计算与网络传输效能高性价。这是亚洲的骄傲,并首先在中国发布。”Etu 知意图负责人蒋居裕在 HBTC 2012 大会上如此表示。
来自 Etu 知意图的大数据系统架构专家施宏良 (Jason Shih) 先生,也和与会嘉宾一起做了“从 Hadoop 安全架构部署实施到高等服务的演变”的精彩分享,施宏良先生认为目前使用 Hadoop 的开源框架,组织和管理庞大的数据量已经成为解决快速数据处理和提高分析能力的趋势。但企业对于数据与集群系统的安全有更高的要求,从不同层面或者访问权限上分离敏感信息和隔离共享存储或计算机设备。在 Hadoop 0.20 之前的版本中,类似 Unix 的文件权限已经提及并提供集群内的简单身份验证机制,但缺乏访问控制每个作业队列,控制提交等操作。为了使用新的安全功能,Etu Appliance 2.0集成了 Kerberos 网络认证协议,使其具备强大的身份验证和授权,保证严格的访问控制数据,资源和隔离之间运行的任务。施宏良先生分享了基于 Kerberos 的 Hadoop 安全集群环境的基础设施部署细节以及如何以此实现高层次的服务。通过 Etu Appliance 的快速部署和自动化系统内置的跨域认证机制,实现现有的活动域与外部 LDAP 域的互操作,并有效减少集成和操作的管理员开销。
2012 年5 月,Etu 知意图正式在北京发布了基于Hadoop 的Etu Appliance 知意图大数据一体机。同年10 月,又针对电子商务的行业特征推出具有针对性的解决方案知意图精准推荐系统 Etu Recommender。标志着Etu 知意图以Etu Appliance 知意图大数据一体机为数据处理平台为基础,支撑多种行业应用的“一横多纵”产品走向初步建立。
大数据起源于互联网,因而使用大数据的人才大多也扎根互联网。为了改善“人才瓶颈就是技术瓶颈”的现状,Etu 知意图为了更好的帮助中国用户实现 Hadoop 大数据处理与分析价值,特别在北京建立了 Hadoop 开发原厂团队和技术支持团队,Etu 知意图大数据一体机降低 Hadoop 采用上的系统门槛,帮助企业跨越大数据处理基础架构的障碍。Etu 知意图清楚的知道 Hadoop 等技术是实现大数据的技术手段,让企业发现数据背后的价值,集中精力透过数据寻找新的商业机会上才是大数据的核心意义。(文章来源:CDA数据分析师)
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13