cs.AI」カテゴリーアーカイブ

StarVector: Generating Scalable Vector Graphics Code from Images and Text

要約 スケーラブル・ベクター・グラフィックス(SVG)は、そのスケーラビリティと … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | StarVector: Generating Scalable Vector Graphics Code from Images and Text はコメントを受け付けていません

Perception Tokens Enhance Visual Reasoning in Multimodal Language Models

要約 マルチモーダル言語モデル(MLM)は、特殊なモデルが得意とする基本的な視覚 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Perception Tokens Enhance Visual Reasoning in Multimodal Language Models はコメントを受け付けていません

FLAIR: VLM with Fine-grained Language-informed Image Representations

要約 CLIPは、画像とテキストを拡大縮小して整列させるという素晴らしい結果を示 … 続きを読む

カテゴリー: cs.AI, cs.CV | FLAIR: VLM with Fine-grained Language-informed Image Representations はコメントを受け付けていません

Navigation World Models

要約 ナビゲーションは、視覚運動能力を持つエージェントの基本的なスキルである。我 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Navigation World Models はコメントを受け付けていません

FCL-ViT: Task-Aware Attention Tuning for Continual Learning

要約 継続学習(Continual Learning:CL)とは、古い知識を忘れ … 続きを読む

カテゴリー: cs.AI | FCL-ViT: Task-Aware Attention Tuning for Continual Learning はコメントを受け付けていません

Time-Reversal Provides Unsupervised Feedback to LLMs

要約 ラージ・ランゲージ・モデル(LLM)は通常、時間の前方向を予測するように学 … 続きを読む

カテゴリー: cs.AI, cs.CL | Time-Reversal Provides Unsupervised Feedback to LLMs はコメントを受け付けていません

Scaling Image Tokenizers with Grouped Spherical Quantization

要約 ビジョントークナイザーは、そのスケーラビリティとコンパクト性から多くの注目 … 続きを読む

カテゴリー: cs.AI, cs.CV | Scaling Image Tokenizers with Grouped Spherical Quantization はコメントを受け付けていません

PKRD-CoT: A Unified Chain-of-thought Prompting for Multi-Modal Large Language Models in Autonomous Driving

要約 ロバストなマルチモーダル大規模言語モデル(MLLM)の能力を、自律走行コン … 続きを読む

カテゴリー: cs.AI, cs.RO | PKRD-CoT: A Unified Chain-of-thought Prompting for Multi-Modal Large Language Models in Autonomous Driving はコメントを受け付けていません

Learning Ensembles of Vision-based Safety Control Filters

要約 制御システムにおける安全フィルタは、安全制約に違反する公称制御を修正する。 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO, cs.SY, eess.SY | Learning Ensembles of Vision-based Safety Control Filters はコメントを受け付けていません

QuadrupedGPT: Towards a Versatile Quadruped Agent in Open-ended Worlds

要約 ロボットエージェントが現実の中で人間を支援する機会が増えている中、四足歩行 … 続きを読む

カテゴリー: cs.AI, cs.RO | QuadrupedGPT: Towards a Versatile Quadruped Agent in Open-ended Worlds はコメントを受け付けていません