猫耳网 2018-11-08 13:58:04 热度:

搜狗CEO王小川:无人驾驶如果只做OS开放平台,没戏!

 11月7日下午,在乌镇举行的第五届世界互联网大会上,搜狗发布了全球首个全仿真智能合成主持人。据搜狗公司CEO王小川介绍,与微软小冰之类的虚拟主持人不同,这个“合成”主播除了声音,还包括唇形及表情。

而在这次大会开幕前两天,搜狗也发布其第三季度财报。财报数据显示,三季度收入2.76亿美元,同比增长7%,但2390万美元的净利润则同比下滑23%。季报称,这部分收入下降的原因在于,智能硬件产品的销售下降,因为搜狗决定升级智能硬件策略,以更好地利用搜狗的人工智能能力并提高产品竞争力。而在接受南方都市报等媒体专访中,王小川也对其人工智能布局、财报表现等问题言无不尽。

 

合成主播是一种“分身”的技术

记者:虚拟主播已经有过很多,搜狗这次跟微软小冰之类的产品有什么不同?它会有什么应用场景?

王小川:我们是一个合成主播,除了声音、还有表情跟唇形,这是一种“分身”的技术,搜狗一直强调从助理、翻译再到分身、问答,一脉相承的技术路线。

作为分身它的使用场景就会有很多。比如我们现在跟“凯叔讲故事”正在谈合作,以前是他来讲故事,但是如果通过声音表情合成有可能变成爸爸妈妈来讲故事,应用于教育场景。

记者:从声音模拟来看,搜狗的主播跟高德地图里的林志玲有什么不同?

王小川:高德地图用林志玲声音做导航,需要录入许多语料,并没有学习过程。而我们需要很少的语料,比如说一个主播只需要录入10分钟的声音就可以将其声音特征模拟到其他的语音内容中,这背后是我们有巨大的数据量支撑,才能实现前端更小的数据样本。

记者:科大讯飞此前提过,翻译的未来是“人机耦合”,语音识别不会取代同传,您怎么看,合成主播是否会取代主播?

王小川:首先AI技术分为感知与认知,在感知方面包括声影图像,机器可以跟人做到基本一样,但认知方面,涉及逻辑性及思考,机器现在做得很有限,这需要分层次看。

合成主播还是需要人的配合。最起码新闻稿需要新华社的编辑去写,它是单向输入这个内容。另外,实际上它是不理解稿子内容的,只是表达视觉与听觉,所以如果跟内容强相关的表情可能做得不够好。

“不依赖智能硬件来赚钱”

记者:从财报看,医疗广告是目前搜狗广告收入占比最高的部分,但您提到要降低医疗广告收入占比?

王小川:医疗上,我们首先要做到内容权威,其次内容优先于广告,降低医疗广告收入也是为了差异化竞争,如果能让用户喜爱度提高,流量变大,收入也会进一步提升。目前,我们的医疗广告收入占比是低于百度的,我们的用户查询占比超过9%,是百度的两倍,而从收入上看,我们是占比20%,而百度是30%。

记者:从智能硬件上看,作为AI业务的体现,智能硬件收入却在下降?

王小川:明年一季度我们也会做一些大众化的智能硬件产品,但不是音箱,因为音箱的主要竞争优势在于便宜,是资金驱动而不是技术驱动,我们会在生活工作方面做一些新的尝试。

另外,不管大众小众,我们不依赖于智能硬件去赚钱。小众产品,比如翻译宝,我们做品牌;未来的大众产品也是做用户量,依赖于巨大的流量可以去做一些广告之类的其他收入方式。

记者:那我们会做车联网吗?

王小川:这不是我们的优势。单纯的AI是不能谈赚钱的,它只是一种技术,不是商业模式,商业模式只有两种,要么卖服务,向B端卖整套解决方案;要么卖产品,去造车。我们是一家2C公司,又没很大的资金量造车。

记者:比如说会做百度Apollo自动驾驶系统这种开放平台模式?

王小川:早期技术创新是来自于一个自我的封闭体系,就像当初PC也是IBM把软件、硬件之类的全做了。开放是一种商业模式创新,是促进一个相对成熟的市场提高效率。从目前看,单纯的一个OS平台是不可能做无人驾驶的,因为没法建立自己的真正核心竞争力。


时间:2018-11-08 13:58:04  来源:搜狐科技    作者:秩名


        声明:猫耳网作为信息发布平台,致力于为读者呈现更丰富多彩的内容。本网抓取转载的相关资讯,仅代表原发媒体主张和作者个人观点,不代表猫耳网立场;猫耳网不提供金融投资服务,所提供的信息不构成投资建议。如您浏览猫耳网或通过猫耳网进入第三方网站进行金融投资行为,由此产生的财务损失,猫耳网不承担任何经济和法律责任。市场有风险,投资需谨慎。


欢迎关注微信公众号:maoer-wang;合作及投稿请联系:editor@98318.com