「cs.CV」カテゴリーアーカイブ

Articulate AnyMesh: Open-Vocabulary 3D Articulated Objects Modeling

投稿日: 2025年5月13日作成者: jarxiv

要約 3Dの明確なオブジェクトモデリングは、正確な表面幾何学と意味的に意味のある … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Stereo Hand-Object Reconstruction for Human-to-Robot Handover

投稿日: 2025年5月13日作成者: jarxiv

要約ハンドとオブジェクトの形状を共同で推定すると、人間からロボットの握手の把握 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Language-Driven Dual Style Mixing for Single-Domain Generalized Object Detection

投稿日: 2025年5月13日作成者: jarxiv

要約単一のドメインでトレーニングされたオブジェクト検出器を複数の目に見えないド … 続きを読む →

カテゴリー: cs.CV, cs.RO, eess.IV | コメントを受け付けていません

Towards Accurate State Estimation: Kalman Filter Incorporating Motion Dynamics for 3D Multi-Object Tracking

投稿日: 2025年5月13日作成者: jarxiv

要約この作業は、3Dマルチオブジェクト追跡（MOT）のカルマンフィルターの状態 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

MOANA: Multi-Radar Dataset for Maritime Odometry and Autonomous Navigation Application

投稿日: 2025年5月13日作成者: jarxiv

要約海上環境センシングでは、過酷な天候、プラットフォームの摂動、大きな動的なオ … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

AdaWorld: Learning Adaptable World Models with Latent Actions

投稿日: 2025年5月13日作成者: jarxiv

要約世界モデルは、アクション制御された将来の予測を学ぶことを目指しており、イン … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Beyond Boundaries: A Comprehensive Survey of Transferable Attacks on AI Systems

投稿日: 2025年5月13日作成者: jarxiv

要約人工知能（AI）システムは、自律車両から生体認証まで、ますます重要なアプリ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CR, cs.CV | コメントを受け付けていません

Think or Not Think: A Study of Explicit Thinking in Rule-Based Visual Reinforcement Fine-Tuning

投稿日: 2025年5月13日作成者: jarxiv

要約このペーパーでは、MLLMSのルールベースの強化微調整（RFT）における明 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

DocVXQA: Context-Aware Visual Explanations for Document Question Answering

投稿日: 2025年5月13日作成者: jarxiv

要約視覚的に自己探求可能なドキュメント質問の回答のための新しいフレームワークで … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Learning to Reason and Navigate: Parameter Efficient Action Planning with Large Language Models

投稿日: 2025年5月13日作成者: jarxiv

要約リモート具体化された参照式（Reverie）タスクでは、エージェントが複雑 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Articulate AnyMesh: Open-Vocabulary 3D Articulated Objects Modeling

Stereo Hand-Object Reconstruction for Human-to-Robot Handover

Language-Driven Dual Style Mixing for Single-Domain Generalized Object Detection

Towards Accurate State Estimation: Kalman Filter Incorporating Motion Dynamics for 3D Multi-Object Tracking

MOANA: Multi-Radar Dataset for Maritime Odometry and Autonomous Navigation Application

AdaWorld: Learning Adaptable World Models with Latent Actions

Beyond Boundaries: A Comprehensive Survey of Transferable Attacks on AI Systems

Think or Not Think: A Study of Explicit Thinking in Rule-Based Visual Reinforcement Fine-Tuning

DocVXQA: Context-Aware Visual Explanations for Document Question Answering

Learning to Reason and Navigate: Parameter Efficient Action Planning with Large Language Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー