-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Geometry Restoration and Dewarping of Camera-Captured Document Images
要約 この研究は、検出、セグメンテーション、ジオメトリ復元、歪み補正のアルゴリズ … 続きを読む
Large language models for artificial general intelligence (AGI): A survey of foundational principles and approaches
要約 視覚言語モデル、大規模言語モデル (LLM)、拡散モデル、視覚言語行動 ( … 続きを読む
Autoregressive Image Diffusion: Generation of Image Sequence and Application in MRI
要約 磁気共鳴画像法 (MRI) は、広く使用されている非侵襲性画像診断法です。 … 続きを読む
Automated Generation of Challenging Multiple-Choice Questions for Vision Language Model Evaluation
要約 ビジョン言語モデル (VLM) の迅速な開発には、厳密で信頼性の高い評価が … 続きを読む
Gaussian Masked Autoencoders
要約 このペーパーでは、ガウス スプラッティングを使用したマスク オートエンコー … 続きを読む
QuArch: A Question-Answering Dataset for AI Agents in Computer Architecture
要約 QuArch は、言語モデルによるコンピューター アーキテクチャの理解を評 … 続きを読む
MixGCN: Scalable GCN Training by Mixture of Parallelism and Mixture of Accelerators
要約 グラフ畳み込みネットワーク (GCN) は、グラフベースの学習タスクにおい … 続きを読む
Multi-Agent Conversational Online Learning for Adaptive LLM Response Identification
要約 大規模言語モデル (LLM) の驚くべき生成機能により、さまざまなアプリケ … 続きを読む
In Search of a Lost Metric: Human Empowerment as a Pillar of Socially Conscious Navigation
要約 社会的ロボットのナビゲーションにおいて、近接性や行動の自然さといった従来の … 続きを読む
Multi-Scenario Reasoning: Unlocking Cognitive Autonomy in Humanoid Robots for Multimodal Understanding
要約 本研究では、ヒューマノイドロボットの認知自律性を向上させるために、マルチモ … 続きを読む