-
最近の投稿
- 3D Water Quality Mapping using Invariant Extended Kalman Filtering for Underwater Robot Localization
- Hybrid Visual Servoing of Tendon-driven Continuum Robots
- Embodying Control in Soft Multistable Grippers from morphofunctional co-design
- View-Invariant Policy Learning via Zero-Shot Novel View Synthesis
- ModSkill: Physical Character Skill Modularization
-
最近のコメント
表示できるコメントはありません。 cs.AI (34028) cs.CL (25726) cs.CR (2616) cs.CV (39965) cs.LG (39031) cs.RO (19850) cs.SY (3019) eess.IV (4757) eess.SY (3013) stat.ML (5150)
「cs.MM」カテゴリーアーカイブ
MetaDecorator: Generating Immersive Virtual Tours through Multimodality
要約 Metadecoratorは、ユーザーが仮想スペースをパーソナライズできる … 続きを読む
Mitigating GenAI-powered Evidence Pollution for Out-of-Context Multimodal Misinformation Detection
要約 大規模な生成的人工知能(Genai)モデルは大幅に成功しましたが、欺cep … 続きを読む
Tune In, Act Up: Exploring the Impact of Audio Modality-Specific Edits on Large Audio Language Models in Jailbreak
要約 大規模言語モデル (LLM) は、さまざまな自然言語処理タスクにわたって優 … 続きを読む
Long-Form Text-to-Music Generation with Adaptive Prompts: A Case of Study in Tabletop Role-Playing Games Soundtracks
要約 この論文では、テーブルトップ ロール プレイング ゲーム (TRPG) の … 続きを読む
Learning to Mask and Permute Visual Tokens for Vision Transformer Pre-Training
要約 自己監視型事前トレーニングの使用は、さまざまな視覚タスクのパフォーマンスを … 続きを読む
GSVC: Efficient Video Representation and Compression Through 2D Gaussian Splatting
要約 3D ガウス スプラットは、静的な 3D シーンの革新的で効果的な学習され … 続きを読む
Sketch and Patch: Efficient 3D Gaussian Representation for Man-Made Scenes
要約 3D ガウス スプラッティング (3DGS) は、3D シーンのフォトリア … 続きを読む
SMPLest-X: Ultimate Scaling for Expressive Human Pose and Shape Estimation
要約 表情豊かな人間の姿勢と形状の推定 (EHPS) は、体、手、顔のモーション … 続きを読む
CLIP-PCQA: Exploring Subjective-Aligned Vision-Language Modeling for Point Cloud Quality Assessment
要約 近年、無参照点群品質評価 (NR-PCQA) 研究は大きな進歩を遂げていま … 続きを読む