“AI换声”爆火暗藏技术隐忧

发布时间:2024-12-21 09:26:23 来源: sp20241221

  本报记者 孙奇茹 鹿杨

  郭德纲飙英文说相声、赵本山用流利的英文演小品、外国歌星泰勒·斯威夫特操着一口地道的中文接受采访……多个国内外明星被AI(人工智能)换声的视频近日在网络上爆火,再次引发公众对AI技术的热议。

  无论是AI换声还是换脸,新技术的使用边界亟待明确,其背后的侵权、诈骗等隐忧更不容忽视。

  飙外语以假乱真

  “I have to take care of this matter!(这事儿我得管)”在一条播放量达百万次的短视频中,身着刺绣大褂的相声演员郭德纲正像模像样地用英文说着《济公传》。记者发现,视频里的声音不仅和郭德纲本人的音色没有什么出入,嘴型和英文发音也一一对应,着实难辨真假。这段精彩的单口相声秀引得网友发出惊叹:“要不是看到视频平台上‘该视频使用AI技术合成’的小字提示,我差点就当真了!”

  除了本土名人说英文,外国歌星泰勒·斯威夫特、演员艾玛·沃森等在访谈节目中用中文对答如流的视频,也引来网友围观。截至发稿前,多个AI换声视频在B站、微博、抖音的浏览量已达到数百万。

  奇安信集团行业安全研究中心主任裴智勇解释,无论声音还是图像,都可以通过特定的数学变换分解成若干个特征向量,对每个向量赋予特定的一组参数,就可以形成特定的声音或图像。所谓AI换声,就是通过机器学习的方法,用某个人以往的声音作为样本进行学习,从而给声音的每个特征向量赋予特定的参数,之后再用这组参数读出新的内容,就可以做到语音、语气甚至情感的模仿了。

  不过,要想达到逼真的效果,据业内人士介绍,除了换声以外,还需要地道的翻译、局部篡改人脸信息对口型等多个步骤后才能实现。

  换声网站走红背后存争议

  随着巨大流量涌入AI换声视频,其背后的公司也浮出水面——2022年7月在海外上线的AI换声网站HeyGen。从如今各大社交平台上爆火的换声短视频自带的水印来看,其中有不少由该网站生成。在该平台上,制作一条换声视频十分简单,用户只需要上传视频,选择语言后,它就能自动翻译并调整音色,生成嘴型匹配的外语视频。

  目前,该网站已推出免费版和付费版两种版本,其中,付费版最低收费为每月24美元,免费版仅限于生成1分钟时长视频。一位该网站用户表示,高峰期时排队人数达上万人。有数据显示,今年8至9月,各大文生图类AI网站的访问量均开始呈现下降趋势,但HeyGen的访问量却上升了92%,流量跃居各大独立AI网站之首。

  然而,与此前的爆款AI应用妙鸭相机一样,HeyGen也面临着争议与热度齐飞。有律师提出,由于HeyGen用户可以将任何人的视频上传并换声,这可能涉嫌著作权、肖像权、声音权三个方面的侵权。比如,相声、小品等都属于《中华人民共和国著作权法》保护的作品,如未经著作权人授权就擅自更改并传播,则存在侵权问题。

  加强治理谨防技术滥用

  面对炉火纯青的AI生成技术,更有网友提出,一旦相关技术被用于网络诈骗,后果将难以想象。裴智勇分析,单纯依靠AI技术是无法完成诈骗的,还必须将其与各种深度的网络诈骗套路结合起来才能成功实施诈骗。在裴智勇看来,绝大多数的传统防骗技巧对于AI诈骗同样有效,“比如有人用视频电话向您借钱,您回拨一个电话确认一下就好了。”

  值得一提的是,目前国内外均有安全机构尝试研发技术手段来识别AI换脸或AI换声。以清华大学人工智能研究院孵化企业瑞莱智慧推出的能够防范生成式人工智能恶意滥用的DeepReal2.0技术为例,其相关技术能够用于打击网络诈骗和声誉侵害行为、检测网络内容合规性、检测音视频物证真实性等,可对生成式人工智能技术滥用行为进行管控和治理。

  记者也注意到,国家网信办等三部门去年联合发布的《互联网信息服务深度合成管理规定》明确,深度合成服务提供者对使用其服务生成或者编辑的信息内容,应当采取技术措施添加不影响用户使用的标识。但目前网络上流传的AI换脸图片和AI换声视频中,有些并未添加相应标识。(北京日报) 【编辑:曹子健】