-
最近の投稿
- KISS-Matcher: Fast and Robust Point Cloud Registration Revisited
- Unpacking Failure Modes of Generative Policies: Runtime Monitoring of Consistency and Progress
- Mode-GS: Monocular Depth Guided Anchored 3D Gaussian Splatting for Robust Ground-View Scene Rendering
- A Universal Formulation for Path-Parametric Planning and Control
- Next Best Sense: Guiding Vision and Touch with FisherRF for 3D Gaussian Splatting
-
最近のコメント
表示できるコメントはありません。 cs.AI (27775) cs.CL (20990) cs.CR (2176) cs.CV (34489) cs.LG (32518) cs.RO (15916) cs.SY (2472) eess.IV (4231) eess.SY (2466) stat.ML (4356)
「cs.MM」カテゴリーアーカイブ
Gpachov at CheckThat! 2023: A Diverse Multi-Approach Ensemble for Subjectivity Detection in News Articles
要約 ソーシャル ネットワークの普及により、主観的で誤解を招く、さらには誤った情 … 続きを読む
CoMoSpeech: One-Step Speech and Singing Voice Synthesis via Consistency Model
要約 ノイズ除去拡散確率モデル (DDPM) は、音声合成において有望なパフォー … 続きを読む
UnifiedGesture: A Unified Gesture Synthesis Model for Multiple Skeletons
要約 共同音声ジェスチャの自動生成は、コンピュータ アニメーションで大きな注目を … 続きを読む
Video Infringement Detection via Feature Disentanglement and Mutual Information Maximization
要約 セルフメディア時代は、私たちに驚異的な高品質のビデオを提供します。 残念な … 続きを読む
Differentiable JPEG: The Devil is in the Details
要約 JPEG は、依然として最も広く普及している非可逆画像符号化方式の 1 つ … 続きを読む
Weakly-Supervised Multi-Task Learning for Audio-Visual Speaker Verification
要約 この論文では、オープンセットの視聴覚話者検証用に最適化された堅牢なマルチモ … 続きを読む
Multi-Modality Multi-Loss Fusion Network
要約 この研究では、複数のモダリティにわたる特徴の最適な選択と融合を調査し、これ … 続きを読む
Language Models as Black-Box Optimizers for Vision-Language Models
要約 Web スケールのデータセットで事前トレーニングされたビジョン言語モデル … 続きを読む
Leveraging Automatic Personalised Nutrition: Food Image Recognition Benchmark and Dataset based on Nutrition Taxonomy
要約 座りっぱなしのライフスタイルや不適切な食生活により、健康的なライフスタイル … 続きを読む