-
最近の投稿
- KISS-Matcher: Fast and Robust Point Cloud Registration Revisited
- Unpacking Failure Modes of Generative Policies: Runtime Monitoring of Consistency and Progress
- Mode-GS: Monocular Depth Guided Anchored 3D Gaussian Splatting for Robust Ground-View Scene Rendering
- A Universal Formulation for Path-Parametric Planning and Control
- Next Best Sense: Guiding Vision and Touch with FisherRF for 3D Gaussian Splatting
-
最近のコメント
表示できるコメントはありません。 cs.AI (27775) cs.CL (20990) cs.CR (2176) cs.CV (34489) cs.LG (32518) cs.RO (15916) cs.SY (2472) eess.IV (4231) eess.SY (2466) stat.ML (4356)
「cs.MM」カテゴリーアーカイブ
VIEScore: Towards Explainable Metrics for Conditional Image Synthesis Evaluation
要約 急速に進歩している条件付き画像生成研究の分野では、さまざまなモデルのパフォ … 続きを読む
UnIVAL: Unified Model for Image, Video, Audio and Language Tasks
要約 大規模言語モデル (LLM) により、ゼネラリスト エージェントの野心的な … 続きを読む
Trajectory Approximation of Video Based on Phase Correlation for Forward Facing Camera
要約 このペーパーでは、視覚的なオドメトリを活用して、GPS が拒否された環境で … 続きを読む
FusionFrames: Efficient Architectural Aspects for Text-to-Video Generation Pipeline
要約 マルチメディア生成アプローチは、人工知能研究において重要な位置を占めていま … 続きを読む
A Challenger to GPT-4V? Early Explorations of Gemini in Visual Expertise
要約 OpenAI の GPT-4V(ision) など、マルチモーダル大規模言 … 続きを読む
Learning from Mistakes: Self-Regularizing Hierarchical Representations in Point Cloud Semantic Segmentation
要約 自律型ロボット技術の最近の進歩により、正確な環境分析の必要性が高まっていま … 続きを読む
A Challenger to GPT-4V? Early Explorations of Gemini in Visual Expertise
要約 OpenAI の GPT-4V(ision) など、マルチモーダル大規模言 … 続きを読む
Debiasing Multimodal Sarcasm Detection with Contrastive Learning
要約 既存の研究によって達成された賞賛に値する成果にもかかわらず、一般的なマルチ … 続きを読む
Debiasing Multimodal Sarcasm Detection with Contrastive Learning
要約 既存の研究によって達成された賞賛に値する成果にもかかわらず、一般的なマルチ … 続きを読む
Part Representation Learning with Teacher-Student Decoder for Occluded Person Re-identification
要約 遮蔽された人物の再識別 (ReID) は、遮蔽障害と不完全なターゲット情報 … 続きを読む