cs.AI」カテゴリーアーカイブ

HumaniBench: A Human-Centric Framework for Large Multimodal Models Evaluation

要約 大規模なマルチモーダルモデル(LMMS)は現在、多くのビジョン言語ベンチマ … 続きを読む

カテゴリー: cs.AI, cs.CV | HumaniBench: A Human-Centric Framework for Large Multimodal Models Evaluation はコメントを受け付けていません

INSIGHT: Enhancing Autonomous Driving Safety through Vision-Language Models on Context-Aware Hazard Detection and Edge Case Evaluation

要約 自律駆動システムは、敵対的な歩行者の動き、危険な車両の操作、突然の環境の変 … 続きを読む

カテゴリー: cs.AI, cs.CV | INSIGHT: Enhancing Autonomous Driving Safety through Vision-Language Models on Context-Aware Hazard Detection and Edge Case Evaluation はコメントを受け付けていません

The Lazy Student’s Dream: ChatGPT Passing an Engineering Course on Its Own

要約 このペーパーでは、学期にわたる学部管理システムコースを正常に完了するための … 続きを読む

カテゴリー: cs.AI, cs.CY | The Lazy Student’s Dream: ChatGPT Passing an Engineering Course on Its Own はコメントを受け付けていません

X-Sim: Cross-Embodiment Learning via Real-to-Sim-to-Real

要約 人間のビデオは、ロボット操作ポリシーをトレーニングするためのスケーラブルな … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | X-Sim: Cross-Embodiment Learning via Real-to-Sim-to-Real はコメントを受け付けていません

EMMOE: A Comprehensive Benchmark for Embodied Mobile Manipulation in Open Environments

要約 自然言語によって制御された自律的なホームロボットの開発は、長い間人類の追求 … 続きを読む

カテゴリー: cs.AI, cs.RO | EMMOE: A Comprehensive Benchmark for Embodied Mobile Manipulation in Open Environments はコメントを受け付けていません

Temporal Triplane Transformers as Occupancy World Models

要約 世界モデルは、将来のシーンの予測を可能にする環境の表現を学習または構築し、 … 続きを読む

カテゴリー: cs.AI, cs.RO | Temporal Triplane Transformers as Occupancy World Models はコメントを受け付けていません

Multi-Robot Task Allocation for Homogeneous Tasks with Collision Avoidance via Spatial Clustering

要約 この論文では、産業環境で行われている均質な測定タスクに関するマルチロボット … 続きを読む

カテゴリー: cs.AI, cs.RO | Multi-Robot Task Allocation for Homogeneous Tasks with Collision Avoidance via Spatial Clustering はコメントを受け付けていません

EmbodiedMAE: A Unified 3D Multi-Modal Representation for Robot Manipulation

要約 ロボット操作のための統一された3Dマルチモーダル表現であるEmbodied … 続きを読む

カテゴリー: cs.AI, cs.RO | EmbodiedMAE: A Unified 3D Multi-Modal Representation for Robot Manipulation はコメントを受け付けていません

UniVLA: Learning to Act Anywhere with Task-centric Latent Actions

要約 ジェネラリストのロボットは、さまざまな環境で効果的に機能する必要があります … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | UniVLA: Learning to Act Anywhere with Task-centric Latent Actions はコメントを受け付けていません

LLM A*: Human in the Loop Large Language Models Enabled A* Search for Robotics

要約 この研究では、ロボットなどのモバイル具体化されたエージェントの(ループ中の … 続きを読む

カテゴリー: cs.AI, cs.HC, cs.RO | LLM A*: Human in the Loop Large Language Models Enabled A* Search for Robotics はコメントを受け付けていません