cs.CV」カテゴリーアーカイブ

Articulate AnyMesh: Open-Vocabulary 3D Articulated Objects Modeling

要約 3Dの明確なオブジェクトモデリングは、正確な表面幾何学と意味的に意味のある … 続きを読む

カテゴリー: cs.CV, cs.RO | Articulate AnyMesh: Open-Vocabulary 3D Articulated Objects Modeling はコメントを受け付けていません

Stereo Hand-Object Reconstruction for Human-to-Robot Handover

要約 ハンドとオブジェクトの形状を共同で推定すると、人間からロボットの握手の把握 … 続きを読む

カテゴリー: cs.CV, cs.RO | Stereo Hand-Object Reconstruction for Human-to-Robot Handover はコメントを受け付けていません

Language-Driven Dual Style Mixing for Single-Domain Generalized Object Detection

要約 単一のドメインでトレーニングされたオブジェクト検出器を複数の目に見えないド … 続きを読む

カテゴリー: cs.CV, cs.RO, eess.IV | Language-Driven Dual Style Mixing for Single-Domain Generalized Object Detection はコメントを受け付けていません

Towards Accurate State Estimation: Kalman Filter Incorporating Motion Dynamics for 3D Multi-Object Tracking

要約 この作業は、3Dマルチオブジェクト追跡(MOT)のカルマンフィルターの状態 … 続きを読む

カテゴリー: cs.CV, cs.RO | Towards Accurate State Estimation: Kalman Filter Incorporating Motion Dynamics for 3D Multi-Object Tracking はコメントを受け付けていません

MOANA: Multi-Radar Dataset for Maritime Odometry and Autonomous Navigation Application

要約 海上環境センシングでは、過酷な天候、プラットフォームの摂動、大きな動的なオ … 続きを読む

カテゴリー: cs.CV, cs.RO | MOANA: Multi-Radar Dataset for Maritime Odometry and Autonomous Navigation Application はコメントを受け付けていません

AdaWorld: Learning Adaptable World Models with Latent Actions

要約 世界モデルは、アクション制御された将来の予測を学ぶことを目指しており、イン … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | AdaWorld: Learning Adaptable World Models with Latent Actions はコメントを受け付けていません

Beyond Boundaries: A Comprehensive Survey of Transferable Attacks on AI Systems

要約 人工知能(AI)システムは、自律車両から生体認証まで、ますます重要なアプリ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.CV | Beyond Boundaries: A Comprehensive Survey of Transferable Attacks on AI Systems はコメントを受け付けていません

Think or Not Think: A Study of Explicit Thinking in Rule-Based Visual Reinforcement Fine-Tuning

要約 このペーパーでは、MLLMSのルールベースの強化微調整(RFT)における明 … 続きを読む

カテゴリー: cs.CV | Think or Not Think: A Study of Explicit Thinking in Rule-Based Visual Reinforcement Fine-Tuning はコメントを受け付けていません

DocVXQA: Context-Aware Visual Explanations for Document Question Answering

要約 視覚的に自己探求可能なドキュメント質問の回答のための新しいフレームワークで … 続きを読む

カテゴリー: cs.CV, cs.LG | DocVXQA: Context-Aware Visual Explanations for Document Question Answering はコメントを受け付けていません

Learning to Reason and Navigate: Parameter Efficient Action Planning with Large Language Models

要約 リモート具体化された参照式(Reverie)タスクでは、エージェントが複雑 … 続きを読む

カテゴリー: cs.CV | Learning to Reason and Navigate: Parameter Efficient Action Planning with Large Language Models はコメントを受け付けていません