京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代语音技术如何满足企业需求_数据分析师
主持人:谢谢,让我们再次感谢来自驰声科技的林总带给我们的演讲,接下来时间是我们圆桌论坛,我们将以此请在座的嘉宾就刚才林总的抛砖引玉,在这方面如果大家有问题,或者有见解欢迎大家发表意见。我们在这里准备了三个问题,第一个,大数据为核心的新技术时代,语音技术如何满足企业需求?比如以驰声可积微代表的语音技术,下一步怎么能够更好的帮助教育优化,更好的服务服务行业。第二个,目前语言教育领域比较流行的新技术有哪些,比较看好的有哪些技术,这些产品是不是已经用了新技术。首先第一个问题,我们想请四位嘉宾进行观点的阐述,首先我们有请读书郎的彭总发表观点。
彭岸青:今天比较荣幸,我看了一下参会名单,读书郎是做学习机的,在参会名单里可能跟传统企业的标签贴的比较多,因为我们做实体产品,直接面对用户的。跟各位很多培训机构和在线机构有一些不一样,今天谈不上经验,我们在教育行业是后知后觉,走的比较慢,我们是封闭式,我们很多功能60%线下就完成的,包括驰声语言引擎也是线上线下的在用。我们今天没有什么经验,更多是困惑,因为读书郎走到传统企业,当然走的也是教育,在这两年的驱使下感觉到很大的压力,在线教育给传统企业带来了很大的压力,以前我们做的更多是概念化的东西,广告、营销、策划等等经验做的比较丰富,进学校,跟培训机构合作等等浅尝辄止,在用户方面,我们相信远远不如现在培训机构和 学习网站,前几年做的很多学习内容和用户数据有很少,但是这些都是死的,都在我们数据库里睡觉。今天说是我们是传统企业很浓厚的标签,今天是来学习的。我们有一点点感触,去年做了后台数据的统计,学生使用学习机进行语音学习和其他正常学习的时间统计,我相信对在座各位行业不一样,有一个可以拿出来参考的,学生每天真正纯粹的,你不给他报培训班,纯粹让他自学的时间最多不会超过20分钟,这是我们累计了很长时间的学习,也就是说电子教育学习机很多时候在睡觉,包括很多应用我们也跟行业内伙伴在合作,学生没有自主学习能力,一个是没有时间,第二个没有控制力,没人监督,根本无法完成这个工作。其实真正到用的时候,比如周末或期中期末考试,反而数据量非常大,我们现在在监控的,学生做作业的时间点和复习的时间点,这两个时间点很大,我们有时候做尝试,我们自己的服务器就扛不过来。我们这一次过来跟参会做的比较好的,尤其是用户研究比较多的,我们希望学习一些经验,怎么利用这20分钟。谢谢。
主持人:谢谢彭总,接下来我们听蓝鸽的江总有什么样的观点。
江黄森:我主要跟大家分享一下我们蓝鸽最近这一两年把口语测评新技术应用到第一课堂的探索。我指的第一课堂是指传统的线下英语教学实景中。最近一年左右,大概十个月的时间,我们把口语测评的技术实际的应用到新建的教室,超过600间实际的教室进行应用,在每一堂英语课里进行了投入使用。主要的应用场景做英语口语教学跟读、领读和人机对话教育模式。经过这样的探索,我们发现有两种极端,这两种极端的形成并不是口语测评技术导致的,而是英语教育,或者学习水平的一个参差不齐而导致的。一方面,对于外语教育水平比较高的学生或学校,我们这种单一的,只针对完整性的流利度,针对性的测评已经没办法满足他们的应用要求。另一方面,对于比较偏远的地区,他们可能还没有达到测评细节的要求,他们仍然停留在好像我们古文的对仗模式,归根到底,我们发现这样一种口语测评技术应用到课堂上,当然有很多技术的问题需要我们解决,比如他会存在及时的高频发,一个课堂有40、50个学生,每个人读一句话立即反馈出测评结果。第二个,对俞老师来说,他是不会按照我们给你提供文本参考的单一模式,他也希望进行测评,总体来讲,我们发现这样的测评还是无法满足当下英语第一课堂的教学要求,他的根本问题在于,我们的测评是基于素材的,而不是针对录用知识结构的。从我们这一年多来的探索,林总最后谈到的观点,用我自己的话,我们讲到云计算和大数据引领我们教育的创新,以数据统计分析为基础口语能力的测评,可能是我们这种测评未来发展方向。可能体现在两个方面,第一个,从语言学上来讲,我们不是对单一的素材,或者某一个学生针对某一个资料完整应用的评价,而是从整个对于语言掌握,比如语音词汇量和表达方式有一个总体或综合的评估。第二个,从应用能力考察和评估,比如我们说他具备了采用英语购物的能力,或者可以办护照的能力,我们能够对他的应用场景,应用能力进行单一纬度的评价,我们当下不管从K12教育还是高等教育,这种企业对于语音测评技术基本的要求,这就是我的一点思考。
主持人:谢谢江总,接下来我们请贺总。
贺瑶瑶:大家好,我是咖啡英语外交在线贺摇摇,咖啡英语是非常新的企业,我们这个平台刚刚建立了一周年,刚刚过了一周年的生日,但是我们发展非常的快,要感谢这个大时代了,在线教育的飞速发展,我们其实推到了风口浪尖,今天这个专场是为我们这样的企业做的。我们经营过程中和线下学员互动过程中有自己的想法,语言培训平台的火爆说明大家对这种培训方式的认可,如何把传统的学习模式转换为在线一一学习模式,其实是非常非常不容易的,首先你要给大家洗脑,让大家接受在线的教育,如何让大家在你平台上留住,这是最重要的。让更多人喜欢这种平台教学,不仅仅是你网站有多漂亮,不仅是你网站有多牛,关键你能不能给客户一个完美的体验流程。什么是完美的体验流程,你所提供的课件,有没有这样一个在线的模式,说明你们的技术能不能跟我们所呈现给客户的课件真正的结合在一起。你说你的技术好,怎么好?怎么呈现给我们终端客户,让他客户体验真正能达到完善,所以我们面对这样技术提供类服务的平台,我们想到的是,我们课件系统怎么样能够跟你结合在一起,结合到孩子们怎么用,成人如何使用,其实那个点是很重要的。无论技术是多么好,在线教育我们关注的是教育本身,如何把教育和技术完美的结合,让用户体验得到真正的提高,这是我们需要的。我们会继续跟驰声合作,之前跟驰声交流,怎么样使我们课件达到最好的形式提供给我们的客户,最后我觉得无论是我们技术有多好,学员有多多,我们最后还是提供一对一老师辅导的过程,老师在整个在线教育中不可缺失的一部分,刚才您提到教师是教学练测育,这五种我们都要集合在在线教育,在线教育才能真正成功。谢谢!
主持人:谢谢贺总。我们下面请三位CTO跟我们聊一聊,目前语言教育领域比较流行的新技术有哪些?您比较看好哪些技术?自己的企业是不是用到了新的技术?我们先请翼课网的孙毅跟我们聊一聊。
孙毅:翼课网是基于课堂的智能化教育平台,所谓基于课堂我们跟一些培训机构在时间窗口上的差异,我们更关注与真正校内课堂教育本身。所谓智能化,我们智能化也是基于大数据和语音技术,包括云计算来做的,我们公司目前还没有过一周岁的生日,还是很年轻。基于今天的主题,第一个问题,目前在语言教育领域的新技术有哪些?我也是做技术出身的,包括今天的主办方新浪也是我的前东家。从我的个人感觉,其实没有绝对的新技术,我们所提到的云计算、大数据等等语音技术已经存在了很久。基于教育行业的特点,教育行业可以说是相对传统行业,相对比较晚的行业。今天本来第一个环节应该是新东方的夏鹏讲技术整合的问题,看到这个标题我也在思考,其实我们今天所谓新技术都是相对的新技术,而我们今天所谓的新技术是1+1如何大于2,我们多种技术整合在一起会成为第三方的新技术我比较看好两类技术,第一个,数据挖掘,数据挖掘和学生诊断,数据挖掘可以做到学生诊断,对于数据挖掘技术首先我们要收集、分析、整理、产出,也就是说我们所说的在处理事务的时候,首先我们要发现问题,分析问题,解决问题,对于技术和教育的整合,我们如何运用技术的手段和工具发现我们的师生在教学环节中的问题,如何利用数据分析而不是主观的臆想,如何基于不同层次的师生提供解决方案。第二个,语音评测和语音评说,我们昨天晚上和驰声的范总在沟通的时候在说,中国人对于口语的发音还是有很多的,不说英文,就比如中文就有发音的区别,当这个地区的人说刘乃(牛奶)大家听懂了,为什么你判断他说的是错误。刚才林总所说的主观评测标准化,我最刚好的技术数据挖掘和语音评测,语音评测我们期望能够解决主观评估的客观化,并且基于地区的一定特色对他进行评测。之前跟刘兆义老师沟通的时候,刘老师提出你们的语音评测为什么把虚词都评出来了,当一个学生对于我们语音引擎很大声说出不是他母语的英语,这时候我们应该给学生更多的鼓励和激励。他说的是E还是N这个并不重要,我觉得对于语音技术,后面我们更多的考虑个性化和人性化的问题。在这里我相信有一定的困难,因为从技术出发他是一套标准,如何从一套标准中形成多套标准,这可能是需要我们一起探索和研究的问题。我们产品中主要应用了驰声一二三代技术,如果第四代技术出来我们马上会应用。目前主要应用我们产品作业系统,竞技系统和自学系统,主要的内容从英语的单词,英语的句子,英语的篇章。
主持人:谢谢孙总,接下来有请大视野教育集团王华先生。
王华:我认为教育不是一个新领域,他有很多的积淀,也很多的内容,我很关注的一件事是我们传统的内容如何转化成符合互联网需要的内容,老树发新芽,我看到很多项目是做新的,新的,旧的东西怎么办。第二个,我非常关注个性化,但是个性化有一个问题,因为我是搞技术的,我们过去所说的个性化,其实把出现的可能性罗列出来,给予你答案,这个叫个性化。其实教育的问题会比较复杂,因为我的老家是一个小山村,所谓个性化其实是很有意思的,老师会针对每个不同的学生做出很多大家想都想不到的办法,所以我想关注的第二个新技术,所谓这种个性化,我觉得现在这个阶段不应该是我们把各种预案放在那选给老师,我们能不能有一种技术,让老师把他个性化教的方式实现就可以了,因为我觉得教育你很穷极他的可能性。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17