投稿者「jarxiv」のアーカイブ

YOLOv11-RGBT: Towards a Comprehensive Single-Stage Multispectral Object Detection Framework

要約 複数のバンドからの情報を統合するマルチスペクトルオブジェクトの検出は、検出 … 続きを読む

カテゴリー: cs.CV | コメントする

Lasso Gripper: A String Shooting-Retracting Mechanism for Shape-Adaptive Grasping

要約 主にグリッパーの形状とサイズの制限のために、輸送の大きさ、可変形状、または … 続きを読む

カテゴリー: cs.RO | コメントする

TACS-Graphs: Traversability-Aware Consistent Scene Graphs for Ground Robot Indoor Localization and Mapping

要約 シーングラフは、ロボットの強力なツールとして浮上しており、高度なタスク計画 … 続きを読む

カテゴリー: cs.RO | コメントする

Non-Overlap-Aware Egocentric Pose Estimation for Collaborative Perception in Connected Autonomy

要約 エゴセントリックポーズ推定は、接続された自律車両などの接続された自律性にお … 続きを読む

カテゴリー: cs.RO | コメントする

Hard Contacts with Soft Gradients: Refining Differentiable Simulators for Learning and Control

要約 コンタクトフォースは、システムの速度にジャンプを導入する際に、ロボットダイ … 続きを読む

カテゴリー: cs.LG, cs.RO, cs.SY, eess.SY, G.1.6 | コメントする

AMPLIFY: Actionless Motion Priors for Robot Learning from Videos

要約 ロボット工学のアクション標識データは不足して高価であり、学習ポリシーの一般 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | コメントする

Pose State Perception of Interventional Robot for Cardio-cerebrovascular Procedures

要約 心臓血管血管介入手術の需要の増加に応じて、介入ロボットの正確な制御がますま … 続きを読む

カテゴリー: cs.RO, cs.SY, eess.SY | コメントする

SmartWay: Enhanced Waypoint Prediction and Backtracking for Zero-Shot Vision-and-Language Navigation

要約 継続的な環境でのビジョンと言語のナビゲーション(VLN)には、制約のない3 … 続きを読む

カテゴリー: cs.CV, cs.RO | コメントする

Hierarchical Intention Tracking with Switching Trees for Real-Time Adaptation to Dynamic Human Intentions during Collaboration

要約 共同作業中、人間の行動は、タスクシーケンスの好みや相互作用戦略など、時間と … 続きを読む

カテゴリー: cs.RO | コメントする

Narrate2Nav: Real-Time Visual Navigation with Implicit Language Reasoning in Human-Centric Environments

要約 大規模なビジョン言語モデル(VLM)は、推論能力を示しながら、文脈的なキュ … 続きを読む

カテゴリー: cs.RO | コメントする