「cs.AI」カテゴリーアーカイブ

HumaniBench: A Human-Centric Framework for Large Multimodal Models Evaluation

投稿日: 2025年5月19日作成者: jarxiv

要約大規模なマルチモーダルモデル（LMMS）は現在、多くのビジョン言語ベンチマ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

INSIGHT: Enhancing Autonomous Driving Safety through Vision-Language Models on Context-Aware Hazard Detection and Edge Case Evaluation

投稿日: 2025年5月19日作成者: jarxiv

要約自律駆動システムは、敵対的な歩行者の動き、危険な車両の操作、突然の環境の変 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

The Lazy Student’s Dream: ChatGPT Passing an Engineering Course on Its Own

投稿日: 2025年5月19日作成者: jarxiv

要約このペーパーでは、学期にわたる学部管理システムコースを正常に完了するための … 続きを読む →

カテゴリー: cs.AI, cs.CY | コメントを受け付けていません

X-Sim: Cross-Embodiment Learning via Real-to-Sim-to-Real

投稿日: 2025年5月16日作成者: jarxiv

要約人間のビデオは、ロボット操作ポリシーをトレーニングするためのスケーラブルな … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO | コメントを受け付けていません

EMMOE: A Comprehensive Benchmark for Embodied Mobile Manipulation in Open Environments

投稿日: 2025年5月16日作成者: jarxiv

要約自然言語によって制御された自律的なホームロボットの開発は、長い間人類の追求 … 続きを読む →

カテゴリー: cs.AI, cs.RO | コメントを受け付けていません

Temporal Triplane Transformers as Occupancy World Models

投稿日: 2025年5月16日作成者: jarxiv

要約世界モデルは、将来のシーンの予測を可能にする環境の表現を学習または構築し、 … 続きを読む →

カテゴリー: cs.AI, cs.RO | コメントを受け付けていません

Multi-Robot Task Allocation for Homogeneous Tasks with Collision Avoidance via Spatial Clustering

投稿日: 2025年5月16日作成者: jarxiv

要約この論文では、産業環境で行われている均質な測定タスクに関するマルチロボット … 続きを読む →

カテゴリー: cs.AI, cs.RO | コメントを受け付けていません

EmbodiedMAE: A Unified 3D Multi-Modal Representation for Robot Manipulation

投稿日: 2025年5月16日作成者: jarxiv

要約ロボット操作のための統一された3Dマルチモーダル表現であるEmbodied … 続きを読む →

カテゴリー: cs.AI, cs.RO | コメントを受け付けていません

UniVLA: Learning to Act Anywhere with Task-centric Latent Actions

投稿日: 2025年5月16日作成者: jarxiv

要約ジェネラリストのロボットは、さまざまな環境で効果的に機能する必要があります … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO | コメントを受け付けていません

LLM A: Human in the Loop Large Language Models Enabled A Search for Robotics

投稿日: 2025年5月16日作成者: jarxiv

要約この研究では、ロボットなどのモバイル具体化されたエージェントの（ループ中の … 続きを読む →

カテゴリー: cs.AI, cs.HC, cs.RO | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

HumaniBench: A Human-Centric Framework for Large Multimodal Models Evaluation

INSIGHT: Enhancing Autonomous Driving Safety through Vision-Language Models on Context-Aware Hazard Detection and Edge Case Evaluation

The Lazy Student’s Dream: ChatGPT Passing an Engineering Course on Its Own

X-Sim: Cross-Embodiment Learning via Real-to-Sim-to-Real

EMMOE: A Comprehensive Benchmark for Embodied Mobile Manipulation in Open Environments

Temporal Triplane Transformers as Occupancy World Models

Multi-Robot Task Allocation for Homogeneous Tasks with Collision Avoidance via Spatial Clustering

EmbodiedMAE: A Unified 3D Multi-Modal Representation for Robot Manipulation

UniVLA: Learning to Act Anywhere with Task-centric Latent Actions

LLM A: Human in the Loop Large Language Models Enabled A Search for Robotics

最近の投稿

最近のコメント

アーカイブ

カテゴリー