腾讯多媒体实验室高级总监商世东在接受采访时,也给出了数据证实其技术实力:
多端通话端到端延时,在 150ms 左右。在公认的国际标准中,这是衡量通话质量是否好的核心标准。
尤其是在互联互通的会议场景中,网络状况、终端设备、使用场景等极为复杂,每一个细小变量都可能相当于“蝴蝶在亚马逊流域扇动了一次翅膀”,对最终结果产生极大影响。
在这样的条件下,保证如此优质的实时音视频通信能力,在全球少有公司能够实现。
商世东说,腾讯会议就是这些领先技术的直接呈现。
开会的本质是要高效互联互通
腾讯为什么要做腾讯会议?产品刚一发布,这个问题再次摆到了腾讯云副总裁吴祖榕面前。
他也是腾讯多媒体实验室总经理,腾讯会议项目的牵头人。
“在过去的一年时间里,我经常会被问到这个问题,”他说。“在腾讯的体系下,很多人会觉得说开会就是这样,微信一个语音拉起来,似乎这个问题就解决了。”
但这并不是会议的本质。吴祖榕认为,开会要解决的是高效沟通跟专业的协同问题。
这也就决定了仅仅依靠微信或者 QQ 语音/视频通话,以及会议室的电话设备等终端根本不够用,也不适合用来在会议场景中,去解决更专业的问题。
一方面在于设备,微信和 QQ 等通讯软件载于手机或者电脑,解决小范围沟通可以,但更大更多的人呢?每个人都举着手机或者抱着电脑打电话?
同时,在使用通讯软件的时候,会议室的电话、电视等终端设备,也无法互联互通。至于采用会议室的电话设备等终端,这是把人都绑定在了设备上,便捷性也没法保证。
另一方面,多设备之间的电话与视频沟通,对于网络也有很严格的要求,网络问题导致通话断断续续,也大大降低了沟通效率。
这些都是当前企业内或跨企业多地开会存在的种种痛点,也是腾讯发布腾讯会议产品的出发点。基于腾讯在音视频通信领域 20 多年的积累,腾讯多媒体实验室表示有信心能解决这些痛点。
在设备方面,他们打通了 VoIP 和 PSTN 传统话机等多种接入设备,支持从窄带、宽带到超宽带等多种采样率和带宽,不管是手机、电脑,还是电话、电视等等,都能接入腾讯会议的系统。
在保证网络稳定性方面,利用了业界领先的带宽预测和流量控制技术;在音质提升方面,通过基于深度学习的音频超分辨力和智能降噪技术,进一步确保用户能接收到更加高清的语音品质,可以提升语音通信的可懂度和主观体验。
而且,考虑到语音通话系统的复杂性,腾讯多媒体实验室还打造了面向真实网络场景的语音质量运维和保障方案,能实时检测通话的质量、对杂音和嘈杂声进行快速定位,持续保障高品质通话。
效果怎么样?腾讯会议产品发布时也给出了数据:基于腾讯云的网络支撑,能实现最低 80ms 的超低延时,就算视频丢包 70% 也不会花屏和卡顿。
对于会议来说,这些都是根本。但对于腾讯会议来说,这只是起步。
用美颜降噪,重新定义开会
在腾讯会议中,腾讯的产品力也有充分的体现。
你能想到,一款视频会议产品中,竟然有美颜和背景虚化功能吗?但这就是腾讯会议的一些亮点功能。
“面对突如其来的视频会议,可能很多女同事会担心自己还没化妆,”商世东说。“我们就把我们原来用在相机里面的美颜算法也用到了会议中来。”
而且不仅仅是手机端,Mac、windows 电脑客户端上也都能美颜。
此外,腾讯会议还上马了降噪功能,这也是腾讯多媒体实验室的看家本领之一。
在商世东的描述中,这是他们延续C端产品的地方,初步降噪之后,还会针对会议的一些常见的噪声,例如:键盘声、咳嗽声、放水杯的声音,进行定点降噪。
“这里面的每一个点点滴滴,都是需要产品经理和研发人员仔细地去打磨,不断地做改进,”商世东还描述了这样一个场景:
为了手机样本,腾讯的工程师会拿着录音设备去公交车地铁站台采集很多移动场景中的噪音,然后把这些采集到的噪声加入平台去做语音降噪的训练。
在他看来,这背后是对他们产品体验不断的追求,毕竟“好的产品他自己会说话”。
但作为一款技术驱动型的产品,体验也都需要建立在技术上。腾讯会议发布后,也为其赢得了诸多好评。
腾讯何以能?
一方面得益于庞大的用户体量,使其能够有足够的数据和场景去优化技术;另一方面是人才,腾讯的确招揽了一批顶级人才来进行研发。
当然,这背后还有一个不能忽视的因素,腾讯上手真的很早,历经了多年迭代。
从 QQ 中心小团队,到腾讯技术底座
说起 20 多年音视频通讯经验积累,要追溯到 1999 年,这时腾讯刚成立一年,QQ 还被称为 OICQ 刚刚问世,音频通话是其基本功能之一。
视频聊天功能,作为 OICQ 更名 QQ 时的重要功能,于 2000 年加入。这就是腾讯对音视频技术关注的起点,也是腾讯会议音视频技术的源头。
虽没有直接涉及太多音视频技术的研发,但在将技术与产品整合, 带来更好的用户体验方面有了不少积累。
这一状况持续了 10 年,也是 QQ 用户快速增长的 10 年