-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
3D-Adapter: Geometry-Consistent Multi-View Diffusion for High-Quality 3D Generation
要約 マルチビュー画像拡散モデルは、オープンドメイン 3D オブジェクト生成を大 … 続きを読む
Unbounded: A Generative Infinite Game of Character Life Simulation
要約 生成無限ゲームの概念を紹介します。これは、生成モデルを使用することで、ハー … 続きを読む
CAMEL-Bench: A Comprehensive Arabic LMM Benchmark
要約 近年、さまざまな視覚的推論と理解タスクを実行できる大規模マルチモーダル モ … 続きを読む
PixelGaussian: Generalizable 3D Gaussian Reconstruction from Arbitrary Views
要約 私たちは、任意のビューから一般化可能な 3D ガウス再構成を学習するための … 続きを読む
PnLCalib: Sports Field Registration via Points and Lines Optimization
要約 放送スポーツ ビデオのカメラ キャリブレーションでは、複数のカメラ角度、さ … 続きを読む
A Review of Prominent Paradigms for LLM-Based Agents: Tool Use (Including RAG), Planning, and Feedback Learning
要約 現在、ツールの使用、計画、フィードバック学習は、さまざまなタスクにわたって … 続きを読む
Geometric Graph Neural Network Modeling of Human Interactions in Crowded Environments
要約 歩行者の行動と相互作用は複雑な性質を持っているため、混雑した環境で人間の軌 … 続きを読む
Composing Diffusion Policies for Few-shot Learning of Movement Trajectories
要約 人間は、毎回スキルを一から学び直すことなく、身体スキルをさまざまに組み合わ … 続きを読む
Real-World Robot Applications of Foundation Models: A Review
要約 大規模言語モデル (LLM) やビジョン言語モデル (VLM) などの基礎 … 続きを読む
Learning to Manipulate Anywhere: A Visual Generalizable Framework For Reinforcement Learning
要約 視覚運動ロボットに、オープンワールドの多様なシナリオで動作する汎用化機能を … 続きを読む