1月15日消息,商汤科技研究院与新加坡南洋理工大学合作设计了迄今为止最大的人脸伪造检测数据集——DeeperForensics-1.0。包含60000个视频,共计1760万帧,是现有同类数据集的10倍。deepfake进化了一版又一版,效果越来越逼真,门槛却越来越低。

换脸是一种深度伪造技术,它从现实中提取人脸,并用其他人的面部特征代替,通常通过人工智能或机器学习实现。目前,它已经被MixBooth和SnapChat等应用推广开来,虽然底层的技术使复杂的图像编辑成为可能,但这也引发了人们对潜在的错用或滥用的担忧。

相关组织已经编译了很多被操控媒体的资料,以支持人脸交换检测方法的发展,但到目前为止公布的样本数量相对较少,或者人为因素影响较大。

研究人员表示,DeeperForensics-1.0是一种新的大规模的人脸伪造检测数据集,被称为是同类中最大的语料库,有超过6万个视频,大约有1760万帧。DeeperForensics-1.0中的所有源视频都是经过精心挑选的,因为它们的质量和多样性都很高。

从表面上看,它们比其他数据集更真实,因为它们更接近于现实世界中的检测场景,并且它们包含与in the wild的压缩,模糊和传输伪像相匹配的特征。

为了构建DeeperForensics-1.0,研究人员收集了来自26个不同国家的100名演员的面部数据,他们的年龄从20岁到45岁不等,他们被要求在九种不同的灯光下转动头部,用超过53种表情自然地说话。他们通过一个人工智能框架(DeepFake Variational AutoEncoder,简称DF-VAE)来运行这些数据,该框架使用了1000个YouTube视频作为目标视频,其中100名演员的脸被交换到10个目标面部上。他用35种不同的方式扭曲每个视频来模拟真实世界的场景,最终的数据集包含了5万个未经处理的视频和1万个经过处理的视频。

研究人员在一份详细说明其工作的印论文中写道:“我们发现,源面部在构建高质量数据集方面比目标面部发挥着至关重要的作用。”“特别是,源面部的表情,姿势和照明越丰富,面部特征交换后的质量越高。”在DeeperForensics-1.0中创建了他们所谓的“隐藏”测试集——一组精心挑选的400个视频,以便在真实场景中更好地模拟假视频。

策划这组视频的过程包括收集由未知的换脸方法生成的假视频,并用真实场景中常见的失真来掩盖这些假视频,最后只选择在用户研究中愚弄了至少50个(总共100个)人类观察者的视频。为了评估DeeperForensics-1.0与其他公开数据集的质量,研究人员让100名计算机视觉专家对其中一部分视频的质量进行排序。他们报告称,与FaceForensics++、Celeb-DF和其他流行的deepfake检测语料相比,DeeperForensics-1.0在真实性方面领先。

在未来的工作中,研究团队打算逐步深入取证领域,并与研究社区合作,确定人脸伪造检测方法的评估指标。与Deepfake的斗争似乎正在升温。去年夏天,美国国防部高级研究计划局的媒体取证项目成员测试了一个原型系统,该系统可以自动检测人工智能生成的视频,部分方法是寻找类似眨眼不自然这样的线索。

初创公司Truepic在7月获得了800万美元的融资,它们正在试验deepfakes的“探测即服务”商业模式。2019年12月,Facebook与人工智能合作伙伴、微软和学术界共同发起了Deepfake探测挑战,该挑战将提供数百万美元的资助和奖励,以促进Deepfake探测系统的发展。

据国际数据公司德勤去年9月发布的《全球人工智能发展白皮书》预计,到2025年世界人工智能市场规模将超过6万亿美元,2017年至2025年复合增长率达30%。

市场虽然很大,但商汤科技在海外布局上也面临挑战。

其中最大的困难就是本地化AI人才匮乏。徐立曾经对媒体解释道,“因为他们人工智能发展的比中国晚,人才储备也相对更紧缺一些。”

在全球布局研发中心培养人工智能顶尖人才,是商汤科技全球化发展战略的重要一环。例如商汤科技在阿联酋设立EMEA(欧洲、中东及非洲地区)人工智能研发中心,这也是继中国、日本和新加坡之后,商汤科技首次在EMEA地区设立办事处,以期通过快速本地化为本地客户定制产品解决方案,推进中国原创AI技术出海,服务全球用户。

同时,商汤科技与全球高校合作,加速推动产学研全球化。目前,商汤科技已与香港中文大学、中科院、清华大学、北京大学、上海交通大学、浙江大学、美国麻省理工学院、新加坡南洋理工大学等顶级高校和学术机构,建立联合实验室或开展科研合作,还发起成立“全球高校人工智能学术联盟”,打造世界顶尖的人工智能学术交流平台。

通过跨越学科、跨越地域的学术合作汇集来自全球的“最强AI大脑”,商汤科技正在将行业巨头、中小企业和高校链接起来,构筑一张国际化的AI生态网。

“人工智能的第一个字是人,有了顶级的人才,一流的AI就水到渠成了。” 在今年的世界人工智能大会上,商汤科技创始人汤晓鸥指出,尊重人才,重视人才培养,AI+教育,十年树木百年树人,才能让原创“源远流长”。

在AI走向实际落地的当下,商汤科技正在通过“全球化”发展战略,拓展积累更多的AI应用经验,依靠国际化人才夯实自身的研发力量,朝着“赋能百业”的底层平台方向进化。

假视频越演越真,引发了广泛的担忧。以AI治AI的行动,也早已展开。此前,Facebook就壕掷千万,举办换脸视频检测挑战赛。UC伯克利EECS教授Hany Farid评价说:为了从信息时代走向知识时代,我们必须更好的辨明真伪,奖真惩假,教育下一代成为更好的数字公民。这需要全面的投资,需要工业界、学界、非政府组织一同努力研究,发展和实施能快速精准辨别真伪的技术。