PVUW 2025 Challenge Report: Advances in Pixel-level Understanding of Complex Videos in the Wild

要約

このレポートは、CVPR 2025と協力して開催されたWild(PVU)チャレンジにおける第4ピクセルレベルのビデオ理解の包括的な概要を提供します。チャレンジの結果、参加方法、および将来の研究の方向性を要約します。
課題には、複雑なシーンのビデオオブジェクトセグメンテーションに焦点を当てたMoseと、モーションガイドの言語ベースのビデオセグメンテーションをターゲットにするMevisの2つのトラックがあります。
どちらのトラックでも、実際のシナリオをよりよく反映するように設計された新しい、より挑戦的なデータセットを導入します。
詳細な評価と分析を通じて、この課題は、複雑なビデオセグメンテーションにおける現在の最先端および新たな傾向に関する貴重な洞察を提供します。
詳細については、ワークショップのWebサイトhttps://pvuw.github.io/をご覧ください。

要約(オリジナル)

This report provides a comprehensive overview of the 4th Pixel-level Video Understanding in the Wild (PVUW) Challenge, held in conjunction with CVPR 2025. It summarizes the challenge outcomes, participating methodologies, and future research directions. The challenge features two tracks: MOSE, which focuses on complex scene video object segmentation, and MeViS, which targets motion-guided, language-based video segmentation. Both tracks introduce new, more challenging datasets designed to better reflect real-world scenarios. Through detailed evaluation and analysis, the challenge offers valuable insights into the current state-of-the-art and emerging trends in complex video segmentation. More information can be found on the workshop website: https://pvuw.github.io/.

arxiv情報

著者 Henghui Ding,Chang Liu,Nikhila Ravi,Shuting He,Yunchao Wei,Song Bai,Philip Torr,Kehuan Song,Xinglin Xie,Kexin Zhang,Licheng Jiao,Lingling Li,Shuyuan Yang,Xuqiang Cao,Linnan Zhao,Jiaxuan Zhao,Fang Liu,Mengjiao Wang,Junpei Zhang,Xu Liu,Yuting Yang,Mengru Ma,Hao Fang,Runmin Cong,Xiankai Lu,Zhiyang Che,Wei Zhan,Tianming Liang,Haichao Jiang,Wei-Shi Zheng,Jian-Fang Hu,Haobo Yuan,Xiangtai Li,Tao Zhang,Lu Qi,Ming-Hsuan Yang
発行日 2025-04-15 16:02:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク