京公网安备 11010802034615号
经营许可证编号:京B2-20210330
人工智能和大脑的结合永远是个真问题。艾漫科技想用大数据替你思考,让你8的轻松愉快,根本停不下来。
黄奕夫妇离婚大战,整个娱乐圈的小朋友都不开心了。我对黄毅清的不负责任表示愤慨,不直接点名,GJJ、shl、yx、wz、LLJ到底是谁啊?
同一天,一个叫“贵圈”的APP上线。用它,1分钟内就能读懂各种猛料,人人都是八卦达人。它的优点是8得轻松又欢乐,至少介绍里是这么写的;缺点是……根本停不下来。
实现超强八卦能力的是大数据。要不是认识这个团队,我肯定以为黄毅清发飙和他们有关。6月黑豆写了一篇 “如果,这就是大数据……” ,提到一家名为艾漫科技的公司怎么用大数据指导电影工业,贵圈是他们利用同一技术平台开发出的C端产品。
这一次,老夏特意带了Daniel与我见面。Daniel有很深的数据背景,一直在中国最会玩数据的几家互联网大公司从事数据挖掘以及商业产品工 作,研究过如何满足亿级用户的产品需求。而且他很懂娱乐圈,知道90后喜欢的是许嵩、本兮,也认识陈奕迅、周杰伦,因此贵圈能把其对大数据的诉求深深的隐 藏在用户需求背后。乍一看产品界面和那些人工编辑的娱乐频道差异不大,但彩蛋处处。
老夏一上来就说:“大数据听得用户都烦了,他们需要看到的是技术和应用的结合。”一名普通用户在意的是爽不爽,而不是技术如何牛。
贵圈的最佳使用场景是“如厕”,古人早就总结过,阅读最佳是“三上”——马上、厕上和枕上。产品分栏只有四个,看、扒、追、我,正好和用户看娱乐内容的过程相符。
说实话,贵圈首屏和很多新闻客户端差别不大。不过,一条你阅读过的内容会被瞬间抹掉,绝对不会再出现在首屏了,再看只能去已读内容中找。屏幕右上 角还有“风向标”,点击就能告诉你现在最热的关键词,每个词都能再扩展阅读。这对那些担心“三天不上网,就成原始人”的用户非常有用。不知道挖掘机的梗或 是EXO没关系,风向标里都有。当然这些关键词是依靠用户访问热度算出来的,抓取的是全网数据。
如果你把一条新闻全部读完,那足以证明你对它有兴趣。新闻底部呈现了一张关系图谱,用户会无痕进入“扒”板块。比如黄奕,你能直接看到和她有联系的6个人,如果还不满足,再点一次会再多6个,再点、再点……考虑到屏幕容量和美感,一个人最多显示30个关联人物。
关系图谱并不稀罕,好多年前,就有一个叫人立方的网站做过;百度搜索结果页右侧,也有关联人物。区别是贵圈画出了人物关系图,而且任意一点都可拓 展,每个被扒出来明星能都能再度成为关系中心。这些内容都是即时用大数据算出来的,所以从这进来也不会漏掉新闻(窃以为1.0的显示速度还略慢)。你可以 从黄奕扒出GJJ,再扒出林峰、佘诗曼、蔡少芬……估计点击三四次你就忘了从哪儿扒到这了。考虑到隐私问题,贵圈只显示公众人物,内容也全部来自公开信 息。对不起,你还不能用它找出你男朋友的前女友们。
老夏犹抱琵琶半遮面的说,图谱关系目前只是1.0阶段。关于它的未来可以有两种“灰暗”想象:虽然不能帮你扒男友的隐私,但这个功能可以被抽成工 具,让你自己去扒啊!还有明星,实现了大数据指导下的UGC,粉丝就能贡献各种信息,将一个人的生活起居都拼出来,方便各种围追堵截。如果真的做了这两件 事,贵圈必定会火的不得了,可法律问题也会随之而来。隐私处理一直是大数据的重要问题,我猜,功能早就做好了,老夏纠结的就是这个。
如果用户的需求还没被满足,说明他是真的关注某个人或某件事,就会进入“追”,不但追星,也在追电影、追电视剧、追话题,同样利用大数据手段不断进行优化。,
对贵圈进行这么多产品描述,是为了阐述它的产品逻辑以及满足用户需求的方法论。每当用户因为不停的扒出谁谁又有一腿停不下来,或者一拍脑袋忘了自 己最开始是在扒谁,老夏就会偷笑。因为他觉得,大数据的真正魅力就是帮人们找到任意事物之间的联系。而这一过程,又很像人脑的意识流。当我们大脑无目的运 转时,也是这么运作的,贵圈不过是把它呈现出来又顺便告诉你了结果。
在大数据技术支持下,贵圈中所有的内容都是动态的。一条新闻在网上出现后,只需0.2秒延迟就能呈现在用户界面。每次用户点击,后台都要重新进行 庞杂的运算。为此,艾漫在三年内连续抓取了1.6PB的数据,公司成立至今花费超过2000万元。这也给艾漫下一轮融资造成一定困扰,因为融资额度要超过 千万美元。
人工智能是不是能代替人脑运转?这是个有趣的哲学问题。大脑和计算机的结合点在哪,这永远是个真问题。显然,把大数据过早的用到医疗、制造、金融 这些严肃的行业中要很谨慎,先拿到娱乐上让人一乐,无妨。他们曾经想过开发一个像小冰一样的机器人回答用户问题,类似张柏芝和谢霆锋会复合吗?研发过程让 Daniel很崩溃,因为艾漫超过70%的员工都是名校工科男,他们在意的是答案准不准,而娱乐产品重要的是够不够有趣。
信息大爆炸时代,用户的烦恼不再找不到信息,而是信息过载。娱乐达人就要失业了,有了工具,我们需要八卦自己去看好了。Daniel严肃告诫贵圈 运营团队,“千万不要给用户push任何信息,我烦。你可以给个红点,但一定不能通知他。”这不是玩清高,因为移动互联网时代,用户主动follow的才 是有价值的。
一年之内,贵圈不考虑任何商业模式。因为不怕BAT,它的时间还比较充裕。娱乐大数据这块蛋糕对老夏和Daniel来说很大,对BAT来说太小 了。大公司有技术,可数据需要积累,技术需要磨练,艾漫已经准备了三年,BAT要做再快也要两年。何况照目前的态势,对于这种业务,BAT更愿意去收购。
相比之下,对艾漫来说用户数据更重要。贵圈通过大数据引擎给用户推荐内容,再根据实际阅读排除噪音,产生新数据再进入闭环。最终他们能找到真正喜 欢某明星的用户,这些数据可以反哺艾漫的toB业务。真正实现了,贵圈会成为明星的真粉丝集合地。老夏说,这就是他心目中的B2C2B的商业闭环布局,是 艾漫的核心竞争力,如果实现别人很难以复制。
老夏说,“粉丝的力量是一般人难以想象的。”他把粉丝界定为喜爱某个明星,并对其有强烈情感认同的人。Daniel曾众筹过一场张震岳的网络演唱 会,金额上限是109元,很少有人只打10元,大部分打了109元。其实,很多人根本没时间去看网上演唱会,但他们愿意支持偶像把演唱会开起来。
粉丝们会用各种方式支持偶像。Daniel还碰到过一位39岁的大姐,是李宇春的忠实粉丝,只要有李宇春的专辑都买,有钱、没闲。每次李宇春开演 唱会,她都会买许多票,请后援团的小伙伴去听,只提两个要求:1、给偶像加油;2、帮助维持秩序和卫生,走时捡走场内垃圾,因为玉米是很有素质的。
如果贵圈可以完成粉丝聚集,至少众筹演唱会是可行的。现实中,明星一场演唱会宣传成本往往过半,再加上场地等成本,经常赔钱。如果直接由粉丝众 筹,赚钱就不难了。更大胆的想法是,艾漫不用参与任何演唱会运作,只要卖API接口给明星团队,谁要开演唱会自己选粉丝去推就行了,就像百度的竞价排名一 样。
或许贵圈会推出直接向用户收费的增值服务,但老夏说:“肯定和功能一点关系都没有,做功能的没有挣钱的”。可以参照的是QQ音乐的绿钻,用户按月 付费后能收听高清品质的音乐。其实大部分付费用户在意的是个人空间背景音乐的外显炫耀感,还有闪耀在头像边的绿钻、“HD”标签和粉丝专享服务,这都和荣 耀、自豪等心理感受有关,和功能无关。老夏说:“艾漫就是要让粉丝之间不再孤独,找到志同道合的知己。”
作为一个堆了七八种乐器在家的音乐爱好者,我却没有在互联网上买音乐收费下载增值业务。为了研究二三线人群的音乐娱乐生活,Daniel曾特意去 富士康蹲点三个月。我不算是贵圈的核心用户,Daniel希望服务好那些杀马特,因为他们比我更需要情感认同,这些屌丝为各种增值业务,付费驱动比白领强 得多。钱穆的《国史大纲》开篇即言:“所谓对其本国已往历史略有所知者,尤必附随一种对其本国已往历史之温情与敬意”。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17