次播放!背后是……

球场上,助攻、传射、绝杀,反转不断。手机前,科技观赛、云上侃球,令人耳目一新。这届世界杯,视频云技术改变了观赛生态,通过切入物理空间的深层肌理,在线上搭建起“全民参与”的场域,在抖音观看世界杯,成为不少球迷首选。

“单场观众人数峰值达1.6亿(阿根廷vs沙特),实时观看人数最高达2146万(日本vs德国)”,这是抖音转播世界杯赛事以来两周的直播数据。据了解,火山引擎作为该平台世界杯直播的主力技术服务商,其大规模超高清直播、RTM超低延迟直播等技术均为首次亮相,为终端用户提供了延时低至1s、大屏级画质、稳定流畅的观赛体验,并延展出“无障碍字幕”“边看边聊”等无障碍功能和创新玩法。

从1958年黑白电视里马赛克般的全损画质,到70年代墨西哥球场的彩色画面,再到如今的超高清、流媒体平台的兴起,世界杯记录了球迷观赛方式的转变,也见证了转播技术的革新速度。

半年前,从央视手中获得卡塔尔世界杯转播权后,抖音投入到赛事直播体验的优化中,为世界杯搭建专属赛事直播间。主攻画面增强的“自研高清低码算法”、提升音频互动体验的“RTC”、RTM超低延迟直播等技术为线上观赛注入了更多科技浓度,让手机端用户也能“身临其境”,与卢塞尔球场“同频共振”。赛事进入下半场,世界杯相关话题在抖音上的播放次数已达481.1亿次。

稳定性和高可靠是保障世界杯这类全球性大型赛事直播体验的底座。据了解,火山引擎边缘云作为视频云的底层能力支撑,为用户创造了稳定、实时、流畅的视频直播观感。本届世界杯期间,其支撑各转播平台创下接近45Tbps的带宽峰值,支持了超千万用户同时在线流畅观看高清直播。

据悉,此次世界杯,抖音在业内首次面向公众移动设备、大规模提供超高清直播。采用自研的高清低码算法,火山引擎视频云针对体育赛事和HDR场景视频进行了深度优化。此外,色彩增强、时空域降噪、超分等画质增强技术,赋予了直播更优质的画质,深度还原了赛场细节。

如何让超高清和低时延可以兼得,则对技术提出了更高要求。火山引擎RTM超低延迟直播技术也在本次世界杯直播中首次亮相,提供大规模分发能力的同时,可将直播画面的端到端延迟降至最低1s左右,实现更高流畅、更低延迟。

丰富的互动玩法是此次抖音世界杯直播的另一亮点。以“边看边聊”功能为例,在支持500人的赛事直播间里,无论是梅西的“神助攻”、C罗的“最后一舞”,还是主题曲“下蛋歌”的洗脑旋律、半自动越位识别等“黑科技”,用户都可以一起喊,一起侃。据抖音《2022世界杯小组赛观赛报告》,尝试这一互动玩法的用户超1000万。为实现“边看边聊”,火山引擎RTC技术攻克了高并发、外放回声、通话人声响度低等难关,提供了高品质的互动体验,如通过音频托管结合自研智能 3A 算法,确保外放场景下无回声,同时,自适应人声音量均衡、智能音频闪避等技术,也让用户获得更清晰流畅的语音交流体验。

沙特对阵阿根廷,比赛进行到第9分钟,由于沙特队员的一次抱摔犯规,阿根廷队获得了点球机会,由梅西主罚。赛事正酣,一串串字幕出现在直播间屏幕左下角。

这是抖音在此次世界杯上线的功能——“无障碍字幕”直播间,其利用火山同传和火山语音的技术,提供低延时、更精准的赛事解说字幕。接到直播流后,火山同传对语音信号进行实时识别,并由人工在30秒内二次校对后推出字幕。

“其实语音识别本身就是一种挑战”,火山语音团队指出,足球比赛瞬息万变,解说中的很多口语现象不可避免,语序颠倒、差异化的语速语气司空见惯,而现场的观众呐喊声等大量背景噪音也容易被误认为“嗯、啊、哈”等语气词,带来识别困扰。

为此,该团队以自研端到端的流式语音识别系统来应对上述问题。通过对大量足球解说场景的音频特征进行分析并进行模型调优,确保在有背景音的情况下也能清晰地识别人声,实现更好的流式字幕效果。

此外,大量的专业术语以及外籍教练与运动员的人名也存在识别难度。本次世界杯,该团队提前整理了大量与足球、世界杯相关的语料,在这些语料的基础上训练语言模型,借助模型干预,提高了其在足球领域的适配性,使同传字幕更专业。

中国听障人群高达2780万,“无障碍字幕直播间”打破了无声画面的静谧,带来了绿茵场上的鲜活沸腾。“以前观看这种节目其实挺迷茫的,脱节带来的孤独感一度让我很沮丧,如今我又找到了那份可以与朋友快乐同步的体验!”“无障碍字幕直播间一出,似乎一下子就把我骨子里的体育DNA带动起来了,再也不用担心跟不上、听不懂了”,部分听障人士表示。

截至12月6日,世界杯无障碍字幕直播间累计观看超1800万次。据悉,火山同传的无障碍字幕方案也在中国消防总队春节消防安全科普、日本艺术家村上隆中国直播首秀、英国艺术家菲利普·考尔波特直播等多场抖音直播中得到了应用。

这场世界杯的线上狂欢背后,一个可以连接所有人的超视频时代正在到来。视频云作为一种新的生产力,从底层变革了观看媒介和赛事转播,全面放大了体育热度。

据《2021抖音体育内容报告》,截至2021年12月,体育内容视频累计点赞量超660亿,足球内容的视频播放量达到了864亿次。不止体育赛事,视频云被越来越广泛地应用于企业直播、泛互游戏、在线教育、广电领域,并为金融、医疗、汽车等传统行业注入动能,在VR、虚拟人等新兴领域,也有其作为技术底层支持方的身影。

我国持续推进数字新基建,视频云行业亦在高速扩张。据IDC发布的《超视频时代视频云演进趋势》白皮书,中国视频云市场规模从2018年的30.6亿美元,增长到2020年的69.6亿美元,复合年均增长率为50.9%。IDC预测,到2025年,全球数据空间中,以视频、图片、音频为主的娱乐数据和非娱乐图像数据占比将超过70%。

与此同时,火山引擎、阿里云、华为云、腾讯云、金山云、声网等一众云厂商纷纷入局。如去年底,火山引擎的78项云产品亮相,其中,视频云以“面向体验”为核心,提供包括视频点播、直播、实时音视频、云游戏和云渲染等产品在内的经验方案。今年7月,火山引擎发布了音视频云端一体解决方案veVOS,向市场提供“抖音同款”的音视频能力。

据了解,在抖音推出低延时世界杯直播之前,火山引擎、腾讯云、阿里云三家企业曾于今年2月联合发布“超低延时直播协议信令标准”,将直播的延迟压缩到1秒,用于体育赛事、电竞直播、电商直播等对延迟要求比较高的场景中。共同的标准,也意味着行业水准的整体提升。

随着视频内容行业竞争的白热化,视频云赛道也在不断拓宽,解锁数实融合新应用。譬如,搭建在线展厅还原线下参展体验的文旅行业、为传统线下门店打通线上销路的新零售、解决偏远山区教育资源匮乏的在线课堂、为实现高频的异地创建远程银行等。未来,以VR/AR、物联网为代表的新场景,亦将成为新的增长空间。

You May Also Like

More From Author

+ There are no comments

Add yours