-
最近の投稿
- KISS-Matcher: Fast and Robust Point Cloud Registration Revisited
- Unpacking Failure Modes of Generative Policies: Runtime Monitoring of Consistency and Progress
- Mode-GS: Monocular Depth Guided Anchored 3D Gaussian Splatting for Robust Ground-View Scene Rendering
- A Universal Formulation for Path-Parametric Planning and Control
- Next Best Sense: Guiding Vision and Touch with FisherRF for 3D Gaussian Splatting
-
最近のコメント
表示できるコメントはありません。 cs.AI (27775) cs.CL (20990) cs.CR (2176) cs.CV (34489) cs.LG (32518) cs.RO (15916) cs.SY (2472) eess.IV (4231) eess.SY (2466) stat.ML (4356)
「cs.MM」カテゴリーアーカイブ
Unveiling the Hidden Realm: Self-supervised Skeleton-based Action Recognition in Occluded Environments
要約 動作認識方法を自律ロボット システムに統合するには、ターゲットの遮蔽を伴う … 続きを読む
Causal-Story: Local Causal Attention Utilizing Parameter-Efficient Tuning For Visual Story Synthesis
要約 拡散モデルの優れたテキストから画像への合成機能により、一貫したビジュアル … 続きを読む
Dual-Modal Attention-Enhanced Text-Video Retrieval with Triplet Partial Margin Contrastive Learning
要約 近年、Web ビデオの爆発的な増加により、ビデオのフィルタリング、推奨、検 … 続きを読む
K-pop Lyric Translation: Dataset, Analysis, and Neural-Modelling
要約 歌詞の翻訳は、1 世紀以上にわたって研究されてきた分野であり、現在、計算言 … 続きを読む
Causal-Story: Local Causal Attention Utilizing Parameter-Efficient Tuning For Visual Story Synthesis
要約 拡散モデルの優れたテキストから画像への合成機能により、一貫したビジュアル … 続きを読む
A Large-scale Dataset for Audio-Language Representation Learning
要約 AI コミュニティは、大規模なマルチモーダル データセットを活用した強力な … 続きを読む
MelodyGLM: Multi-task Pre-training for Symbolic Melody Generation
要約 事前トレーニングされた言語モデルは、さまざまな音楽の理解と生成のタスクにお … 続きを読む
Accelerating Diffusion-Based Text-to-Audio Generation with Consistency Distillation
要約 拡散モデルは、大部分の Text-to-Audio (TTA) 生成方法を … 続きを読む
MelodyGLM: Multi-task Pre-training for Symbolic Melody Generation
要約 事前トレーニングされた言語モデルは、さまざまな音楽の理解と生成のタスクにお … 続きを読む