长沙晚报掌上长沙6月21日讯(全媒体记者 尹玮)第三届“马栏山杯”国际音视频算法大赛开赛啦!前两届比赛吸引了超过3000名国内外选手报名参加,获得了巨大成功。本届大赛包括自由视角、用户下一个观看一视频预测、无参考视频画质机器评价等来自业界实践的挑战赛题,报名截止时间为8月16日12时,预计9月9日颁奖。
第三届“马栏山杯”国际音视频算法大赛湖南省互联网信息办公室主办,芒果TV与马栏山视频文创产业园共同发起。和前两届大赛一样,本届大赛的三大赛题均源自业界实际需求,涵盖内容生产、内容推送、内容理解三个方面。
内容生产方面的赛题为“自由视角”。
在热门综艺《舞蹈风暴》中,有一个震撼全场的“3D立体风暴时刻”,可从任意角度展现舞蹈细节,还原舞蹈艺术的灵动瞬间。这是怎么做到的呢?原来是现场设置的近百台摄像机,对舞蹈演员进行全方位拍摄,再经过自动校准、采集存储、云端传输、编码生成等环节,就变成了让观众眼前一亮的画面。这一高维度、多视角的全新视觉体验一经推出,就备受好评。三维视频技术还可用于体育赛事直播、车祸现场重建等场景,在时下热门的元宇宙领域也是重要技术基础。
但传统的三维视频,都需要多台摄像机实时拍摄。有没有一种可能,已知少数摄像机的图像和其他摄像机的位置,就能自动生成其余的图像?“自由视角”赛题就是要解决这问题,芒果TV提供了92个相机协同采集的高清图像,和对应相机的内外参数,希望选手据此设计出一套高效准确的方法,根据相机参数和部分已知图像去生成其他角度的图像。数据集来自芒果TV的国内首个4K光场拍摄棚,该棚可用于动态人物建模等专业影视级特效的拍摄,这也是国内相关比赛中首次有如此之高的量级、精度的数据,非常有参考价值。
内容推送方面的赛题为“用户下一个观看一视频预测”。
在很多网站上都有这样的功能——观众在浏览完一个视频后,页面会推送一组关联内容,点击就可以继续观看。比如看完赏心悦目的帅哥集锦后,很多网友会留言“请大数据记住我”,希望未来方便及时地欣赏到更多美男子,而不是辛辛苦苦地搜索。虽然及时发现用户的兴趣和调整内容展示是非常重要的目标,但实际上,在给定用户观影历史和上下文的行为条件下,进行序列预测是非常困难的任务。本赛题就以此为背景,希望选手在真实样本数据集的条件下建立最优的序列预测模型。数据集包括视频类型、标签、上线时间、出现的重要人物等特征,但都经过了脱敏处理,不包含用户个人隐私。
内容理解方面的赛题为“无参考视频画质机器评价”。
视频画质评价是指对视频图像的清晰度、失真损伤程度、色彩等进行感知、衡量和评价,分为有参考评估、无参考评估。有参考评估是对处理前后的视频进行评价,无参考评估在没有原视频场景,如节目摄制、海量内容转码生产等场景中有重要应用。本赛题以芒果TV视频内容在手机移动端条件下的观看体验为研究背景,选手需要设计一套算法或模型,自动判断视频质量,进而保障和提升观众的观看体验。
“马栏山杯”已成功举办两届,其取材于真实的应用场景、激发更好的技术方法等特点让其名声大震。第三届对赛题进行了升级,在难度、趣味、丰富程度等方面都有不一样的体验,并首次推出三维视角相关赛道,希望从音视频算法角度探索热门话题元宇宙。参赛形式为个人或团队,团队人数不超过三人。每个赛道的前十名均可获得奖金。
感兴趣的程序员可扫描下方二维码参与报名。