「cs.AI」カテゴリーアーカイブ

Navigating the Digital World as Humans Do: Universal Visual Grounding for GUI Agents

投稿日: 2024年10月8日作成者: jarxiv

要約マルチモーダル大規模言語モデル (MLLM) は、グラフィカルユーザー … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

SFTMix: Elevating Language Model Instruction Tuning with Mixup Recipe

投稿日: 2024年10月8日作成者: jarxiv

要約インタラクション駆動型タスクの大規模言語モデル (LLM) に望ましい動作 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Causal Micro-Narratives

投稿日: 2024年10月8日作成者: jarxiv

要約我々は、テキストから因果関係のあるミクロナラティブを分類するための新しいア … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.IR, cs.LG | コメントを受け付けていません

GLEE: A Unified Framework and Benchmark for Language-based Economic Environments

投稿日: 2024年10月8日作成者: jarxiv

要約大規模言語モデル (LLM) は、自然言語によるコミュニケーションが普及し … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CY, cs.GT, cs.LG | コメントを受け付けていません

mDPO: Conditional Preference Optimization for Multimodal Large Language Models

投稿日: 2024年10月8日作成者: jarxiv

要約直接設定最適化 (DPO) は、大規模言語モデル (LLM) の調整に効果 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Data Advisor: Dynamic Data Curation for Safety Alignment of Large Language Models

投稿日: 2024年10月8日作成者: jarxiv

要約データは、大規模言語モデル (LLM) の調整において重要な要素です。最 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Task-unaware Lifelong Robot Learning with Retrieval-based Weighted Local Adaptation

投稿日: 2024年10月7日作成者: jarxiv

要約実世界の環境では、ロボットは過去に学習した能力を保持しながら、新しいスキル … 続きを読む →

カテゴリー: cs.AI, cs.RO | コメントを受け付けていません

SPINE: Online Semantic Planning for Missions with Incomplete Natural Language Specifications in Unstructured Environments

投稿日: 2024年10月7日作成者: jarxiv

要約ロボットの能力が高まるにつれ、ユーザーはハイレベルなミッションを記述し、ロ … 続きを読む →

カテゴリー: cs.AI, cs.RO | コメントを受け付けていません

Multi-Robot Motion Planning with Diffusion Models

投稿日: 2024年10月7日作成者: jarxiv

要約拡散モデルは近年、データから複雑なマルチモーダル行動を学習するための幅広い … 続きを読む →

カテゴリー: cs.AI, cs.MA, cs.RO | コメントを受け付けていません

LLaRA: Supercharging Robot Learning Data for Vision-Language Policy

投稿日: 2024年10月7日作成者: jarxiv

要約視覚入力を持つLLM、すなわち視覚言語モデル（VLM）は、状態情報を視覚的 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

Navigating the Digital World as Humans Do: Universal Visual Grounding for GUI Agents

SFTMix: Elevating Language Model Instruction Tuning with Mixup Recipe

Causal Micro-Narratives

GLEE: A Unified Framework and Benchmark for Language-based Economic Environments

mDPO: Conditional Preference Optimization for Multimodal Large Language Models

Data Advisor: Dynamic Data Curation for Safety Alignment of Large Language Models

Task-unaware Lifelong Robot Learning with Retrieval-based Weighted Local Adaptation

SPINE: Online Semantic Planning for Missions with Incomplete Natural Language Specifications in Unstructured Environments

Multi-Robot Motion Planning with Diffusion Models

LLaRA: Supercharging Robot Learning Data for Vision-Language Policy

最近の投稿

最近のコメント

アーカイブ

カテゴリー