-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
StarVector: Generating Scalable Vector Graphics Code from Images and Text
要約 スケーラブル・ベクター・グラフィックス(SVG)は、そのスケーラビリティと … 続きを読む
Perception Tokens Enhance Visual Reasoning in Multimodal Language Models
要約 マルチモーダル言語モデル(MLM)は、特殊なモデルが得意とする基本的な視覚 … 続きを読む
FLAIR: VLM with Fine-grained Language-informed Image Representations
要約 CLIPは、画像とテキストを拡大縮小して整列させるという素晴らしい結果を示 … 続きを読む
Navigation World Models
要約 ナビゲーションは、視覚運動能力を持つエージェントの基本的なスキルである。我 … 続きを読む
FCL-ViT: Task-Aware Attention Tuning for Continual Learning
要約 継続学習(Continual Learning:CL)とは、古い知識を忘れ … 続きを読む
カテゴリー: cs.AI
FCL-ViT: Task-Aware Attention Tuning for Continual Learning はコメントを受け付けていません
Time-Reversal Provides Unsupervised Feedback to LLMs
要約 ラージ・ランゲージ・モデル(LLM)は通常、時間の前方向を予測するように学 … 続きを読む
Scaling Image Tokenizers with Grouped Spherical Quantization
要約 ビジョントークナイザーは、そのスケーラビリティとコンパクト性から多くの注目 … 続きを読む
PKRD-CoT: A Unified Chain-of-thought Prompting for Multi-Modal Large Language Models in Autonomous Driving
要約 ロバストなマルチモーダル大規模言語モデル(MLLM)の能力を、自律走行コン … 続きを読む
Learning Ensembles of Vision-based Safety Control Filters
要約 制御システムにおける安全フィルタは、安全制約に違反する公称制御を修正する。 … 続きを読む
QuadrupedGPT: Towards a Versatile Quadruped Agent in Open-ended Worlds
要約 ロボットエージェントが現実の中で人間を支援する機会が増えている中、四足歩行 … 続きを読む