cs.AI」カテゴリーアーカイブ

Scene Graph Generation in Large-Size VHR Satellite Imagery: A Large-Scale Dataset and A Context-Aware Approach

要約 衛星画像 (SAI) におけるシーン グラフ生成 (SGG) は、知覚から … 続きを読む

カテゴリー: cs.AI, cs.CV | Scene Graph Generation in Large-Size VHR Satellite Imagery: A Large-Scale Dataset and A Context-Aware Approach はコメントを受け付けていません

MuirBench: A Comprehensive Benchmark for Robust Multi-image Understanding

要約 マルチモーダル LLM の堅牢なマルチ画像理解機能に焦点を当てた包括的なベ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | MuirBench: A Comprehensive Benchmark for Robust Multi-image Understanding はコメントを受け付けていません

Explore the Limits of Omni-modal Pretraining at Scale

要約 私たちは、あらゆるモダリティを理解し、普遍的な表現を学習できるオムニモーダ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | Explore the Limits of Omni-modal Pretraining at Scale はコメントを受け付けていません

Real2Code: Reconstruct Articulated Objects via Code Generation

要約 コード生成を通じて多関節オブジェクトを再構築する新しいアプローチである R … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Real2Code: Reconstruct Articulated Objects via Code Generation はコメントを受け付けていません

Is Programming by Example solved by LLMs?

要約 Programming-by-Examples (PBE) は、入出力サン … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.PL, cs.SE | Is Programming by Example solved by LLMs? はコメントを受け付けていません

MMWorld: Towards Multi-discipline Multi-faceted World Model Evaluation in Videos

要約 マルチモーダル言語言語モデル (MLLM) は、「ワールド モデル」、つま … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | MMWorld: Towards Multi-discipline Multi-faceted World Model Evaluation in Videos はコメントを受け付けていません

DualCross: Cross-Modality Cross-Domain Adaptation for Monocular BEV Perception

要約 トレーニングと展開の間の領域のギャップを埋めること、および複数のセンサー … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | DualCross: Cross-Modality Cross-Domain Adaptation for Monocular BEV Perception はコメントを受け付けていません

Scaling Manipulation Learning with Visual Kinematic Chain Prediction

要約 多様なデータセットから汎用モデルを学習することは、機械学習において大きな成 … 続きを読む

カテゴリー: cs.AI, cs.RO | Scaling Manipulation Learning with Visual Kinematic Chain Prediction はコメントを受け付けていません

AnyRotate: Gravity-Invariant In-Hand Object Rotation with Sim-to-Real Touch

要約 人間の手は、さまざまな手の動きがある場合でも手の中で操作することができます … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | AnyRotate: Gravity-Invariant In-Hand Object Rotation with Sim-to-Real Touch はコメントを受け付けていません

Hierarchical Reinforcement Learning for Swarm Confrontation with High Uncertainty

要約 群れロボット工学では、追跡回避ゲームを含む対立が重要なシナリオです。 未知 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Hierarchical Reinforcement Learning for Swarm Confrontation with High Uncertainty はコメントを受け付けていません