淘宝曝光虚拟主播 声音样本采自马云、高晓松

  • 来源:网络
  • 更新日期:2020-09-01

摘要:  原标题:淘宝曝光虚拟主播 声音样本采自马云、高晓松   本报记者 李立 上海报道   淘宝直播在最近一次内部分享会上曝光了虚拟主播,这个由阿里达摩院直接支持的项目从

  原标题:淘宝曝光虚拟主播 声音样本采自马云、高晓松

  本报记者 李立 上海报道

  淘宝直播在最近一次内部分享会上曝光了虚拟主播,这个由阿里达摩院直接支持的项目从今年年初秘密启动。

  从曝光样本看,虚拟主播Bonne在主播休息时独立上岗,可以进行商品播报,为用户提供24小时智能货品推荐和1对1的在线服务。

  “不管碰到什么问题,智能主播都可以在直播中给消费者解答,帮助主播和粉丝更好互动,”淘宝直播产品负责人岱妍告诉《中国经营报》记者,研制虚拟主播有两层目的,一是帮主播在休息时值班,做粉丝运营;二是在直播过程中,帮主播去完成一些没有办法及时完成的随时应答和粉丝互动,起辅助作用。

  马云、矮大紧变声主播?

  虚拟主播将不再是冷冰冰的机器,会和主播的个性化做强匹配,有独立的人设、独特的说话方式和声线,包括丰富的表情。短发、活泼,说话时大眼睛忽闪忽闪的虚拟主播Bonne,原型就是岱妍本人。

  岱妍向记者透露,当时“抠”这个形象的初衷就是想让产品经理自己上阵,亲自体会怎么做主播怎么为粉丝提供更好的服务。

  虚拟主播的开发是人工智能场景中非常复杂的应用之一,淘宝内部相关负责人告诉记者,淘宝直播背后站的是达摩院和顶级科学家,这个今年才开始的项目最根本的目的是帮助商家提效,阿里会在这个技术层面上持续投入,这也会是淘宝直播和其他直播平台的重要区别之一。

  “主要的技术挑战来自两个层面,”阿里巴巴达摩院资深算法专家陈海青介绍,“第一个是人物表现力,怎么去结合多模态的信息去做人物表现力,比如嘴型、表情和肢体的驱动,同时涉及到大量的数据、以及大量的群体模型的数据搜集。

  二是声音表现力,基于场景化的声音怎么能做到更好的表现力。剧本和商品挑战也很大,即便今天有大量的商品和详情页的数据,但是遇到‘双11’这样的重要节点,我们的技术还只具备小样本数据下的工作和能力。”陈海青说。

  “在主播的人物驱动上,个性化TTS(人类语音用人工合成的方式产生)是很重要的一环。”据陈海青透露,很重要的一个重点在于目标说话人少且质量差,带有噪音混响,快速还原难度就很大。不过现在已经可以做到手机录音20句,90%的还原度,在半小时内完成构建。

  记者发现声音采集样本中,收录了马云、逍遥子、高晓松(花名矮大紧)、周冬雨等人的声音样本,根据录音样本可以让马云、高晓松的声音出现在更多的场景里,比如让马云直播带货介绍商品,高晓松直接开口飙英文都可以实现。

  在人物驱动上,虚拟主播还在追求更细节的处理。经过数据对比发现,不同的语气、口头禅都会对直播带货产生不同影响,比如主播一开口套用了李佳琦的句式,“OMG,今年的大促活动也太划算了吧”,对商品的形容更具体生动“emm壳很酥脆,夹心也是入口即化哦”,带货的效率和转化率都会明显提升。

  躺赚粉丝?

  虚拟主播的带货效果究竟如何,红人主播林珊珊团队负责人凌霄分享了试用心得。

  “刚开始收到虚拟主播这个产品,从心里是拒绝的,觉得这个东西可能没有真人那么种草,甚至他会不会拔草”,但试用下来数据还不错。

  凌霄告诉记者,“第一次试用,共有14.6万观看,最高在线1400人,增粉240人”,粗略计算,以一个粉丝一年在店铺成交1万元,就等于增加240万GMV,“并且这些都是半夜里主播在睡觉时发生的”。

  淘宝方面暂时没有公布虚拟主播的转化率和具体的上线时间,“但是在粉丝增量、时长和对GMV的拉动很有想象力”,据岱妍介绍,目前虚拟主播的上线场次已经超过了1000场。

  不过据记者了解,虽然淘宝直播一直采取小心试水的姿势,但虚拟主播已经在内部确定为重点扶持的方向。

  今年3月 ,万像文化科技跟淘宝直播合作的首个虚拟二次元主播上线, 3分钟就吸引30万卖家在线观看。手机屏幕上是穿着格子裙、黑长直发的动漫小姐姐演示一款气垫粉底,其实镜头前的是一位穿着黑色运动服、扎着马尾的主播。

  在4月“淘宝直播MCN机构大会”的内部会议上,淘宝宣布四大MCN赛道中,虚拟主播作为二次元赛道中的主要承载部分,淘宝宣布对其进行重点扶持。

  在业内人士看来,和真人主播相比,虚拟主播更具趣味性,可以帮助降低主播的心里压力,自由度也更高,但技术门槛和成本都偏高。在虚拟直播的赛道上,淘宝直播最看重的还会是在特定场景下的带货能力。

  虚拟主播在未来是否有可能代替真人直播,岱妍则表示不太可能,“我们很清楚在直播带货中人的重要性,真人主播无可取代的一点就是真实性”。