cs.AI」カテゴリーアーカイブ

3D-Adapter: Geometry-Consistent Multi-View Diffusion for High-Quality 3D Generation

要約 マルチビュー画像拡散モデルは、オープンドメイン 3D オブジェクト生成を大 … 続きを読む

カテゴリー: cs.AI, cs.CV | 3D-Adapter: Geometry-Consistent Multi-View Diffusion for High-Quality 3D Generation はコメントを受け付けていません

Unbounded: A Generative Infinite Game of Character Life Simulation

要約 生成無限ゲームの概念を紹介します。これは、生成モデルを使用することで、ハー … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.GR, cs.LG | Unbounded: A Generative Infinite Game of Character Life Simulation はコメントを受け付けていません

CAMEL-Bench: A Comprehensive Arabic LMM Benchmark

要約 近年、さまざまな視覚的推論と理解タスクを実行できる大規模マルチモーダル モ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.CY, cs.LG | CAMEL-Bench: A Comprehensive Arabic LMM Benchmark はコメントを受け付けていません

PixelGaussian: Generalizable 3D Gaussian Reconstruction from Arbitrary Views

要約 私たちは、任意のビューから一般化可能な 3D ガウス再構成を学習するための … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | PixelGaussian: Generalizable 3D Gaussian Reconstruction from Arbitrary Views はコメントを受け付けていません

PnLCalib: Sports Field Registration via Points and Lines Optimization

要約 放送スポーツ ビデオのカメラ キャリブレーションでは、複数のカメラ角度、さ … 続きを読む

カテゴリー: cs.AI, cs.CV, I.2 | PnLCalib: Sports Field Registration via Points and Lines Optimization はコメントを受け付けていません

A Review of Prominent Paradigms for LLM-Based Agents: Tool Use (Including RAG), Planning, and Feedback Learning

要約 現在、ツールの使用、計画、フィードバック学習は、さまざまなタスクにわたって … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SE | A Review of Prominent Paradigms for LLM-Based Agents: Tool Use (Including RAG), Planning, and Feedback Learning はコメントを受け付けていません

Geometric Graph Neural Network Modeling of Human Interactions in Crowded Environments

要約 歩行者の行動と相互作用は複雑な性質を持っているため、混雑した環境で人間の軌 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO, cs.SY, eess.SY | Geometric Graph Neural Network Modeling of Human Interactions in Crowded Environments はコメントを受け付けていません

Composing Diffusion Policies for Few-shot Learning of Movement Trajectories

要約 人間は、毎回スキルを一から学び直すことなく、身体スキルをさまざまに組み合わ … 続きを読む

カテゴリー: cs.AI, cs.RO | Composing Diffusion Policies for Few-shot Learning of Movement Trajectories はコメントを受け付けていません

Real-World Robot Applications of Foundation Models: A Review

要約 大規模言語モデル (LLM) やビジョン言語モデル (VLM) などの基礎 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Real-World Robot Applications of Foundation Models: A Review はコメントを受け付けていません

Learning to Manipulate Anywhere: A Visual Generalizable Framework For Reinforcement Learning

要約 視覚運動ロボットに、オープンワールドの多様なシナリオで動作する汎用化機能を … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Learning to Manipulate Anywhere: A Visual Generalizable Framework For Reinforcement Learning はコメントを受け付けていません