cs.AI」カテゴリーアーカイブ

Navigating the Digital World as Humans Do: Universal Visual Grounding for GUI Agents

要約 マルチモーダル大規模言語モデル (MLLM) は、グラフィカル ユーザー … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Navigating the Digital World as Humans Do: Universal Visual Grounding for GUI Agents はコメントを受け付けていません

SFTMix: Elevating Language Model Instruction Tuning with Mixup Recipe

要約 インタラクション駆動型タスクの大規模言語モデル (LLM) に望ましい動作 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | SFTMix: Elevating Language Model Instruction Tuning with Mixup Recipe はコメントを受け付けていません

Causal Micro-Narratives

要約 我々は、テキストから因果関係のあるミクロナラティブを分類するための新しいア … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR, cs.LG | Causal Micro-Narratives はコメントを受け付けていません

GLEE: A Unified Framework and Benchmark for Language-based Economic Environments

要約 大規模言語モデル (LLM) は、自然言語によるコミュニケーションが普及し … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CY, cs.GT, cs.LG | GLEE: A Unified Framework and Benchmark for Language-based Economic Environments はコメントを受け付けていません

mDPO: Conditional Preference Optimization for Multimodal Large Language Models

要約 直接設定最適化 (DPO) は、大規模言語モデル (LLM) の調整に効果 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | mDPO: Conditional Preference Optimization for Multimodal Large Language Models はコメントを受け付けていません

Data Advisor: Dynamic Data Curation for Safety Alignment of Large Language Models

要約 データは、大規模言語モデル (LLM) の調整において重要な要素です。 最 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Data Advisor: Dynamic Data Curation for Safety Alignment of Large Language Models はコメントを受け付けていません

Task-unaware Lifelong Robot Learning with Retrieval-based Weighted Local Adaptation

要約 実世界の環境では、ロボットは過去に学習した能力を保持しながら、新しいスキル … 続きを読む

カテゴリー: cs.AI, cs.RO | Task-unaware Lifelong Robot Learning with Retrieval-based Weighted Local Adaptation はコメントを受け付けていません

SPINE: Online Semantic Planning for Missions with Incomplete Natural Language Specifications in Unstructured Environments

要約 ロボットの能力が高まるにつれ、ユーザーはハイレベルなミッションを記述し、ロ … 続きを読む

カテゴリー: cs.AI, cs.RO | SPINE: Online Semantic Planning for Missions with Incomplete Natural Language Specifications in Unstructured Environments はコメントを受け付けていません

Multi-Robot Motion Planning with Diffusion Models

要約 拡散モデルは近年、データから複雑なマルチモーダル行動を学習するための幅広い … 続きを読む

カテゴリー: cs.AI, cs.MA, cs.RO | Multi-Robot Motion Planning with Diffusion Models はコメントを受け付けていません

LLaRA: Supercharging Robot Learning Data for Vision-Language Policy

要約 視覚入力を持つLLM、すなわち視覚言語モデル(VLM)は、状態情報を視覚的 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | LLaRA: Supercharging Robot Learning Data for Vision-Language Policy はコメントを受け付けていません