京公网安备 11010802034615号
经营许可证编号:京B2-20210330
如何评价《人民日报》于 10 月 5 日发表的《不能让算法决定内容》?
《人民日报》(4 版)10 月 5 日发表题为《不能让算法决定内容》的文章。文章称,随着大数据、人工智能的广泛应用,一些商业网站、移动新闻客户端,都在运用算法这个「读心术」。文章指出,技术往往是一把冷冰冰的双刃剑,在价值和利益的天平上,所谓的算法成为了利益的砝码。一切围着流量转,唯点击量、转发量马首是瞻,「标题党」泛滥,价值取向跑偏,内容沦为附庸。
文章认为,算法不是王法,算法决定内容更不是王道。只有算法回归到服务内容的角色,变得有态度、有深度、有温度,才能让人们在信息的海洋里尽情遨游、在清朗的环境中自由飞翔,才能使网络空间碧波荡漾,激发出源源不断的正能量。
不吹不黑。只从技术角度来看,《人民日报》这篇文章也提到了一个很有意义的问题,那就是信息化时代我们很容易在不知不觉中被推荐内容“洗脑”。在现有技术手段下,适当引入人工筛选可以遏制一些有害行为,如软文推广、诈骗信息、虚假新闻等。
简单的科普一下媒体流常用的推荐算法:
在新用户注册时,你会被要求填写一些感兴趣的话题,作为初始“种子”进行文章推送。比如你表明你对篮球感兴趣,那么你的首页有很大比例都是篮球相关。
随着你的浏览量上升,比如关注了不同媒体或者大量浏览某个话题的文章以后,平台就会提高这类内容的占比。比较传统的协同算法,就是找到和你兴趣相似的人并把他们的浏览内容推荐给你,或者和当前文章相类似主题的文章。
当你看的文章越来越多,风格越来越鲜明以后,你的账户会被打上一些“标签”,对你的浏览爱好进行分类。有时候有社交属性的网站还会把使用者进行网络化/图谱化分析,加强推荐的准确性。
1. 推荐算法有什么问题?
你只能看到特定的话题,很难跳出这个信息圈。而这种效应会不断加强,时间久了容易一叶障目不见泰山。普通用户感兴趣的话题还是以生活、娱乐为主,导致其他有意义内容的生存空间比较小。不难发现,信息分发平台的每日推送头条常常是以明星八卦为主。慢慢的,你发现你对每个明星的行程了如指掌,但并不知道原来自动驾驶汽车已经上路实验好几年了。
很多网站试图加入一些“创新元素”,比如也会推荐“你可能对XXX感兴趣”。但往往这类帮助用户跳出“舒适圈”的信息流都很难引起大家的兴趣,还往往被用户批判一番。于是,最终能存活在大量用户时间线上的信息就主要是吸引眼球的爆款文了。这不仅促进了“标题党”和“博眼球”,也使得用户的精力花在了没有营养的内容上。
2. 如何利用推荐算法“作恶”?
对于推荐系统的依赖也给了别有用心的人发挥空间。大部分平台的推荐内容中都有一些难以分辨的广告推广、高级软文、甚至诈骗等。比如,一篇介绍中老年疾病的科普文章最后变成了销售保健品,可谓防不胜防。这可能是因为平台技术能力不足,也有可能是装作看不见甚至推波助澜,毕竟最后可以把锅推给算法。推荐系统不仅可以计算出推荐什么内容,也可以推测你适合的广告有哪些。即使不用算法推荐,人工推荐其实早就出现在了分发平台上,只不过更多的用在了商业推广上。
因此,标榜推荐算法的平台也有“作恶”的权力,比如慢性洗脑。请相信潜移默化的力量,慢慢的你会以为这些软文这是自己想看的内容,可能还在现实生活中购买了相关的产品。
3. 如何平衡推荐算法和人工筛选?
在法律法规和技术能力的双重限制下,不妨这么想:
站在官方角度考虑,建议将现在百分之二十的推荐文章替换为“我们需要阅读的文章”,比如“两学一做”等主旋律文章。很多平台,比如澎湃早就走了这个路线。这部分文章由编辑/运营手动选择,推荐给所有用户并关闭评论。在将来,或许当地政府选择“适合当地人民的内容”...这是时代的选择,我们都无可选择。
站在个人用户的角度,建议将系统推荐中百分之二十替换成“开阔眼界”的文章,比如前沿科技、艺术赏析、文化历史等。在比例不高不引起用户反感的前提下,尝试给用户提供一些不同的内容。
人工筛选也应该被用在识别“有害的内容上”,处理那些算法无法识别的恶意信息。很多高级的推广写的极具迷惑性,现在的语义分析能力并不能很好的区分出来。虚假新闻也很难依靠算法识别,这也是编辑/运营可以手动检索的内容之一。
科技企业也需要提高自己的业务道德。不是每一种钱都可以赚,人血馒头不能吃。如果明知是恶意信息但因为有利益原因还是将其推荐给用户,我宁可我们没有先进的技术。那些因为科技公司作恶而倾家荡产甚至失去生命的人的名字并没有远去,只是很容易被遗忘。内容推荐、新闻推送只不过是不同平台上的另一个应用,而类似的悲剧已经够多了。
4. 如果我不喜欢推送或者不愿意被“洗脑”怎么办?
技术宅建议还是选择自己订阅感兴趣的主题如RSS,或者写爬虫从特定站点收集自己感兴趣的话题。依赖于主流媒体的内容推送,不管是人工还是系统推荐,或多或少对会被洗脑。“定制化”和“效率”很难兼得。你如果要节省时间从平台处吸收资讯,就得接受他们“强奸”你的思想。
5. 这篇文章对于我们有什么启发?
换个角度看,这篇文章无心插柳地给普通大众提了个醒,要对于科技发展和技术公司保持警惕。大部分用户已经把安全和隐私完全交给了科技公司,现在连自己能看到什么也交了出去,这是无奈但正在发生的事情。过去短短几年,我们已经见识了多少科技公司做过的“恶”。
“民主”和“自由”本身就是对立的。问题的核心还在于提高分发平台的商业道德和技术能力,以及用户的阅读分辨能力。在短时间内,这两件事都不会发生,所以增加人工推荐的比例也不完全是个坏点子。我不反对利用人工筛选来增加些“主旋律内容”,但也希望增加一些“拓展眼界”的文章,并利用人工来减少一些迷惑性强的有害内容。
退一步说,大时代下没有人能独善其身,这也只是个开始而已 ʕ* ᴥ* ʔ
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,商业竞争的核心已从“经验驱动”转向“数据驱动”,越来越多的企业意识到,商业分析不是简单的数据统计与报表呈现 ...
2026-05-06在Excel数据透视表的实操中,“引用”是连接透视表与公式、辅助数据的核心操作,而相对引用作为最基础、最常用的引用方式,其设 ...
2026-05-06 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-05-06在Excel数据分析中,数据透视表是汇总、整理海量数据的高效工具,而公式则是实现数据二次计算、逻辑判断的核心功能。实际操作中 ...
2026-04-30Excel透视图是数据分析中不可或缺的工具,它能将透视表中的数据快速可视化,帮助我们直观捕捉数据规律、呈现分析结果。但在实际 ...
2026-04-30 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-04-30在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-04-28箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-04-27在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23