
编辑:大明
【导读】斯坦福大学研究人员给AI模型看了100部好莱坞电影,让AI看懂了什么是接吻,并从视频片段中分割识别出接吻的镜头场景,而且把接吻和性爱场景区分开来。嗯,想开车的朋友可能要等等,但想看吻戏的朋友这回可以一次看个够了。
和大多数没有接过吻的人一样,AI学接吻这件事最开始也是通过观看爱情电影片段进行的。AI通过看电影来了解关于接吻的基本知识,尤其是看看那些好莱坞明星的嘴唇动作究竟是什么样的。
研究人员对熟练掌握识别面部识别和目标识别的深度学习算法进行了训练,识别由专业演员戏剧化的热吻场景,这表明,AI系统已经能够更深入地了解最亲密的人类“交流”活动。
电影《泰坦尼克号》中男女主角著名的“船头接吻”镜头
这项研究来自Netflix的高级数据科学家Amir Ziai,他正在斯坦福大学攻读AI专业研究生。Ziai从过去一个世纪的好莱坞电影数据库中挑选了100部电影的代表性片段。然后手动将不同的电影片段标记为接吻/非接吻场景,并使用来自这些片段的静止图像帧和声音片段来训练深度学习算法,以检测影片中亲吻的场景和声音。
寻找非交叉接吻动作分割片段的算法伪代码
不过请不要误会,目前还不清楚这个测吻的方法是否可以用于亲吻之外的进一步性爱场景的识别。对此,Ziai 表示:“在我的训练数据集中有意远离了过度的性爱场景,以确保模型不会混淆接吻和性爱”。
Ziai目前的雇主Netflix没有参与斯坦福大学的这项研究,该研究一发表在预印本服务器arXiv上。Ziai尚未研究该技术在Netflix上的能否获得一些应用前景。但不难想象,这类视频识别技术可能会让Netflix或其他公司(如YouTube,Facebook,Instagram和TikTok)很感兴趣,由此技术开发出的商业应用可以处理大量流媒体或存储视频。
2019年4月,谷歌宣布其Pixel智能手机已经能够接收Photobooth功能更新,可以在智能手机摄像头拍摄的视频中检测到接吻时进行自动拍照。Ziai展示了与视频有关的接吻检测技术,未来的应用可以对视频内容进行自动分类,为用户打造个性化的视频推荐列表,甚至可能充当在线视频审核的部分作用,对某些内容的视频进行筛选。
“这是一个很好的例子,说明现代计算机视觉技术如何能够相当容易地开发特定的'感知和响应'软件,提示定性/非结构化的东西(如场景中的接吻),”OpenAI策略与转播主管杰克·克拉克说,他的导入人工智能新闻通讯,最近突出了亲吻检测研究。“我认为这是AI改变个人软件开发方面,未来受关注潜力最高的领域之一。”
目前对亲吻场景识别最成功的深度学习模型是ResNet-18,这是一种图像分类算法,已经基于ImageNet数据库中的超过一百万张图像进行了预训练。为了能够正确识别接吻的声音,使用名为VGGish的深度学习模型,利用每个接吻场景的一秒钟片段的后960毫秒的音频进行了训练。
使用这种双管齐下的训练方式,AI模型处理接吻的图像和音频的方式,让整个模型获得了高达的0.95的F1分数 - 这一分数用于衡量算法(对于误报和假阴性的)精度的加权平均值。
但是,面对一些电影场景中视频编辑过多,以及和摄像机角度问题时,模型可能会无能为力。拍摄演员接吻的远景镜头有时会骗过算法,因为这种情况下,大部分相机镜框内都是风景背景。快节奏的视频剪辑和不包括两个演员的镜头也证明是具有挑战性的。
要弄清究竟是AI模型究竟是根据哪些特定数据模式进行预测是比较困难的事情。人类尝试理解AI逻辑的一种方法是使用显着性图来突出显示在分析过程中受到AI最多关注的数据。在好莱坞电影中的亲吻场景中,深度学习模型似乎更加关注与演员面部相关的图像像素。
Ziai说,一些“有限的实验”也表明,AI模型更依赖视觉特征,而不是音频特征来识别接吻场景。实验表明,利用更加“精心调整的数据集”会更有利于接吻探测系统的性能发挥,并且可能利用更多的背景信息,而不仅仅是靠静止图像来识别接吻场景。
帕特里克·斯维泽和黛米·摩尔在1990年的电影《幽灵》中的接吻画面,该影片是数据科学家用于训练AI模型识别接吻场景选取的100部电影之一
目前还不清楚AI模型在全部100部好莱坞电影中的识别表现如何,如《安娜·卡列尼娜》(1935),《幽灵》(1990)和《皇家赌场》(2006)将在更大的电影数据集中发挥作用。但是,在训练数据集超过80个视频后,该模型仅仅出现了“边际化的性能提升”,Ziai说。好莱坞电影数据集和一些计算资源由斯坦福大学计算机科学助理教授Kayvon Fatahalian实验室提供。
另一个问题是,这种接吻AI识别模型是否能够在检测社交媒体上常见的视频中的接吻场景时表现出相当的精度。这一挑战可能需要对更大的视频数据集进行额外的训练。尽管如此,一些初步测试仍然表明,这种方式有望诞生更广泛的AI接吻检测应用。
“这项研究的尝试是使用多样化的数据集,让模型不会过度适应任何特定类型的电影,”Ziai说。“有趣的是,它似乎在我发现的一些YouTube视频上的性能表现相当不错。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
K-S 曲线、回归与分类:数据分析中的重要工具 在数据分析与机器学习领域,K-S 曲线、回归和分类是三个核心概念与工具,它们各 ...
2025-07-31大数据时代对定性分析的影响 在大数据时代,海量、多样、高速且低价值密度的数据充斥着我们的生活与工作。而定性分析作为一 ...
2025-07-31CDA含金量分析 在数字经济与人工智能深度融合的时代,数据驱动决策已成为企业核心竞争力的关键要素。CDA(Certified Data Analys ...
2025-07-31SASEM 决策树:理论与实践应用 在复杂的决策场景中,如何从海量数据中提取有效信息并制定科学决策,是各界关注的焦点。SASEM 决 ...
2025-07-30SPSS 语法使用详解 在当今数据驱动的时代,SPSS( Statistical Package for the Social Sciences)作为一款功能强大的统计分析软 ...
2025-07-30人工智能对CDA数据分析领域的影响 人工智能对 CDA(Certified Data Analyst,注册数据分析师)数据分析领域的影响是全方位、多层 ...
2025-07-30MySQL执行计划中rows的计算逻辑:从原理到实践 MySQL 执行计划中 rows 的计算逻辑:从原理到实践 在 MySQL 数据库的查询优化中 ...
2025-07-29左偏态分布转正态分布:方法、原理与实践 左偏态分布转正态分布:方法、原理与实践 在统计分析、数据建模和科学研究中,正态分 ...
2025-07-29CDA 数据分析师的职业生涯规划:从入门到卓越的成长之路 在数字经济蓬勃发展的当下,数据已成为企业核心竞争力的重要来源,而 CD ...
2025-07-29CDA数据分析师证书考取全攻略 一、了解 CDA 数据分析师认证 CDA 数据分析师认证是一套科学化、专业化、国际化的人才考核标准, ...
2025-07-29解析神经网络中 Softmax 函数的核心作用 在神经网络的发展历程中,激活函数扮演着至关重要的角色,它们为网络赋予了非线性能力, ...
2025-07-29解析 response.text 与 response.content 的核心区别 在网络数据请求与处理的场景中,开发者经常需要从服务器返回的响应中提取数 ...
2025-07-29鸢尾花判别分析:机器学习中的经典实践案例 在机器学习的世界里,有一个经典的数据集如同引路明灯,为无数初学者打开了模式识别 ...
2025-07-29用 Python 开启数据分析之旅:从基础到实践的完整指南 在数据驱动决策的时代,数据分析已成为各行业不可或缺的核心能力。而 Pyt ...
2025-07-29从 CDA LEVEL II 考试题型看 Python 数据分析要点 在数据科学领域蓬勃发展的当下,CDA(Certified Data Analyst)认证成为众多从 ...
2025-07-29CDA 数据分析师的工作范围解析 在数字化时代的浪潮下,数据已成为企业发展的核心资产之一。CDA(Certified Data Analyst)数据分 ...
2025-07-29解析 insert into select 是否会锁表:原理、场景与应对策略 在数据库操作中,insert into select 是一种常用的批量数据插入语句 ...
2025-07-29用 Power BI 制作地图热力图:基于经纬度数据的实践指南 在数据可视化领域,地图热力图凭借直观呈现地理数据分布密度的优势,成 ...
2025-07-29从数据到决策:CDA 数据分析师如何重塑职场竞争力与行业价值 在数字经济席卷全球的今天,数据已从 “辅助工具” 升级为 “核心资 ...
2025-07-292025 年 CDA 数据分析师考纲焕新,引领行业人才新标准 在数字化浪潮奔涌向前的当下,数据已成为驱动各行业发展的核心要素。作为 ...
2025-07-29