49彩票集团首页-49彩票集团官网|官网首页

49彩票集团让大家拥有最好的账号使用功能,49彩票集团是为大家带来更加方便的使用途径,是因为在49彩票集团娱乐的玩家们越来越多,发展成为最受欢迎的网上体育娱乐公司。

中国科学技术大学讯飞、搜狗等技艺集团相继发

2020-02-12 作者:计算机网络   |   浏览(174)

AI的这种音色迁移技术可称为变声技术,可以将任何人的声音转换成特定人的声音。与国内的IT公司比较起来,搜狗公司的AI变声功能已经达到实用的阶段。搜狗CEO王小川在一场大会上进行了展示。通过手机软件,王小川用AI变声模拟了高晓松和东北妹子的声音,引得现场连连发笑。

他表示,对于音频用户来说,同样的内容,读稿和讲述的收听体验会有很大区别,只有最真实的人声才能引发深刻的情感共鸣,也是音频的价值所在。

那么,什么样的工作将会被取代?人类是否会被机器取代?

通过AI手段,用户可以一秒变声为社会名人或者其他想要模仿的声音。

今年,很多AI公司发力语音合成在变声、语音cos等场景下的应用,将真人发出的声音转化成特定声音。

值得注意的是,再度亮相峰会的搜狗同传,全程吸引着观众的目光——对比中英翻译准确率,有人感叹“同传要失业了”,也有人发现“AI的理论课”被翻译为了“爱的语文课”。

2019年4月,全国人大常委会审议的《民法典人格权编》里加了一条规定:任何组织和个人不得以利用信息技术手段伪造的方式侵害他人的肖像权。同样,如果AI语音技术发展了,也应当加上不得以信息技术手段伪造的方式侵害他人的声音权,同时要单独在人工智能立法中涉及AI合成不得侵犯他人的肖像权、声音权等。任何未经授权的合成肖像、合成音频均属于侵权违法行为。

如果有一种技术可以一秒复制或模仿你讲话,你会感到惊喜还是惊恐?

49彩票集团 1

49彩票集团,讲话到面孔的AI语音技术完全可以应用到刑事鉴识中,可以与较早的模拟画像技术一道成为刑事鉴识的补充技术。模拟画像技术是基于找不到嫌疑人的影视资料、声音和照片,或者是嫌疑人的图像很模糊,只能通过受害人或目击者的口述,由刑侦人员画出嫌疑人的相貌。2017年6月9日,克里斯滕森杀害中国访问学者章莹颖,在案件侦查之初,美国联邦调查局就向擅长模拟画像的中国警官林宇辉发出邀请,请他协助画出嫌犯的画像,而当时能提供的嫌犯图片就来自街边监控摄像头上的模糊截图。

此外,在一些行业,这样的技术也将带来新的思考。比如一些音频会被篡改,引发社会问题;在未来的影视剧中,可能出现明星替身AI换脸、AI合成的配音等现场。虽然这些技术,一定程度上节约了影视剧制作成本,加快影视剧制作的进程,但在道德和人文层面释放的价值观还需要商榷。

在他看来,担心人类被机器取代或超越,其实是一种狭隘的思想,人类应当去接受机器在很多场景下替代人的部分功能,或者增强人的部分功能。

尽管如此,还是需要有一部明确的法律来规范包括语音、肖像等在内的AI新产品和应用,使其只能向善行善,而非向恶行恶。漫画/陈彬

也就是说,未来随着AI图像生成技术的进步,可以仅仅通过一张照片就能生成虚假视频。

“我们一直在寻求人和机器的关系。”王小川表示,谈未来,一定要理解二者的关系。当阿尔法狗带来“启蒙”后,究竟什么样的工作将会被取代?人类是否会被机器取代?——这也是过去三年,王小川被问得最多的事情。

比起AI之前的语音服务,如导航、智能音箱、问题解读等,变声技术是AI语音技术的重要升级,如果说之前的AI语音服务还在追求以什么样的语音,以及如何使AI的语音更像人的声调和音色为用户和公众提供更好的服务,那么现在的AI变声技术则进一步扩大了AI的应用范围,既有可能让AI语音更好为公众服务,也有可能让AI语音步入歧途,成为诈骗的工具。前者是向善和行善,后者是从恶和行恶。

而在道德和安全层面上,牛森认为,首先要从技术上对人声和合成音进行筛选确认,从权利上需要明确版权链条,任何未经授权的合成音频属于侵权违法行为,“作为平台方我们会进行严格的版权和品质把控”。

王小川表示,在人类最擅长的领域里,机器的设计原理从目前可知道的技术程度是无法到达的;反过来,机器所擅长的领域,人也做不到。同时,人类所共有的智能、生命力以及适应环境的能力,在可见的技术里面,机器也不可能具备。

责任编辑:周星如

在美国,就已经有人利用人工智能将色情视频里的女主角换成女明星。这一技术正引发恐慌,遭到查封。

阿尔法狗带来“启蒙”

不过,与AI变声技术相似的另一种AI语音技术似乎向善的成分大一些,这就是讲话到面孔技术,也可称为闻声识人技术。研究人员设计了一种智能软件,把网上搜集的数百万段教学和音像视频中的每个人的面部特征与其讲话的声音特点匹配和相联,形成一种可供计算机学习的大数据,通过深度学习,这种智能软件仅仅通过听一个人的声音就可以画出其相貌,而且八九不离十,但是,现在这种软件还不成熟。

据外媒报道,三星位于莫斯科的人工智能实验室研究人员,基于大量动图和视频素材,以及“深度卷积神经网络”训练,通过AI技术准确识别某些面部特征,可以将静止图像变为动图甚至视频。

王小川从机器的强大与局限性两个层面作出解释。他认为,尽管在听觉、视觉等对信息低层次处理的感知上,人工智能已经具备足以超越人类的强大能力,但在以语言为代表的认知领域,机器最终只能成为为人类服务的辅助工具。

AI语音技术是AI的一个分支,随着AI技术的发展,AI语音技术也在突飞猛进换代升级。现在,科大讯飞、搜狗等科技公司相继发布了语音合成技术的应用。通过AI手段,用户可以一秒变声为社会名人或者其他想要模仿的声音。

进入2019年,AI技术的应用落地越来越多样化。科大讯飞、搜狗等技术公司相继发布了语音合成技术的应用。通过AI手段,用户可以一秒变声社会名人或者其他想模仿的声音。

“比赛后,我们发现很多年轻朋友把阿尔法狗称为狗狗,对它有很高的接受度,围棋九段选手们把它称为阿老师。”王小川说,“今天,我们通过拟人化的方式接纳了机器。这种接纳的速度会更快一些。”

无论是AI变声技术,还是讲话到面孔的AI语音技术,都是AI语音技术的升级。技术是中立的,关键在于如何使用这类技术。在这类技术应用于社会生活和工作之前,制定对其严格管理的措施极为紧迫和必须。

“你看到的是刘庆峰,但听到的是老罗的声音。”台上的刘庆峰表示,这是公司最新的实时变声技术。据悉,这项新的语音合成技术只需要1分钟的声音样本,就可以模仿任何人说话。

让表达和信息获取变得更简单

AI的变声技术是一种逼真的语音合成技术,它的基础是神经网络和机器学习。神经网络模拟电信号在人脑神经元之间的传递过程,对输入数据进行处理,从大量样本数据中总结出共同特征,再通过机器学习模拟特定人的声音,达到以假乱真的效果。显然,这样的变音技术有很多用武之地,凡是可以采用语音或有声服务的地方,都可能获得这类服务和应用,如语音交互、有声读物、新媒体、智能客服、大众娱乐等。不过,AI变声技术的短板也是显著的,如果有人利用这种技术向任何特定的人打电话以扮演其亲人、朋友、同事、上级的声音,就会让人难以辨别真假。

目前,AI技术的落地应用,正在不断打通虚拟世界和现实世界的界限,我们需要思考的是,如果未来这些技术越来越强大和普及,明辨真假将会变得越来越困难,技术发展的同时又该如何把控安全隐患问题?

尽管还未做到百分百完美,但另一个问题在于,当技术进化得越来越准确,人类真的会被机器取代吗?

1、搜狗不向第三方输出变声技术,确保该技术的可控性和安全性。

语音识别之后,唇语识别、语音合成、AI语音变声等更多技术应用也陆续上线。其中,搜狗首次投入实用的AI语音变声技术,可以把任何人的声音转化成特定声音,“堪称人类表征学习的一次重大突破”。

3、变声后的声音在微信、QQ等App中使用,不能转发复制,能够做到对发送者追踪溯源。

无论是“变声”为高晓松或东北腔,从专业角度看,这种技术已经不再是简单的语音合成,而是同时将语音、语调、情感做出的迁移。王小川说,与之类似的场景是未来技术可能为人类社会带来的颠覆性变化。

在此之前,AI换脸也曾在社交媒体上引起热议。有人将94版《射雕英雄传》里朱茵扮演的黄蓉换上了杨幂的脸,网友直呼“毫无违和”“以假乱真”,甚至调侃“老剧新拍最省成本的方式”。

纵观人类历史发展,每次都源于重要的技术突破,而距离人类最近的信息文明,正在计算机和互联网的推动下快速发展。阿尔法狗与李世石的“人机大战”,王小川将之称为一场“启蒙运动”。

另一方面,未来可能存在的技术漏洞、技术滥用等风险也不容忽视。有网友就指出“小心被用于电信诈骗”“以后可能会收到‘马云’的电话”……

“大家好,欢迎来到极客公园2019年现场……”当搜狗CEO王小川的这句话“变成”高晓松的声音传进听众的耳朵,台下掌声四起。

2、变声功能的所有目标音色都由搜狗定义,不支持用户随意模仿。

“我们的使命是在人工智能中做简单的工作,让表达和信息获取变得更加简单,在大时代找到自己的位置。”王小川总结到。

其实,AI技术背后的“以假乱真”现象不只出现在声音领域,近日三星的一项技术应用也引起人们的注意。

他进一步解释道,如果以语言为核心去探讨与之相关的感知和认知,感知是处理语音、图像,认知则是处理对话、翻译和问答。以搜狗最新的AI探索为例,他表示,“搜狗是中国今天To C领域语音识别量最大的引擎。因为我们拥有中国最大的输入法,每天有超过6亿次语音识别请求,包括语音修改,目的就是以语言为核心使得人跟人通过感知能进行更好的沟通。”

本文由49彩票集团发布于计算机网络,转载请注明出处:中国科学技术大学讯飞、搜狗等技艺集团相继发

关键词:

  • 上一篇:没有了
  • 下一篇:没有了