月別アーカイブ: 2024年3月

Reaching Consensus in Cooperative Multi-Agent Reinforcement Learning with Goal Imagination

要約 コンセンサスに達することが、複数のエージェントの調整の鍵となります。 協力 … 続きを読む

カテゴリー: cs.AI, cs.LG | Reaching Consensus in Cooperative Multi-Agent Reinforcement Learning with Goal Imagination はコメントを受け付けていません

MOKA: Open-Vocabulary Robotic Manipulation through Mark-Based Visual Prompting

要約 オープンな語彙の一般化には、複雑で多様な環境とタスクの目標を伴うタスクを実 … 続きを読む

カテゴリー: cs.AI, cs.RO | MOKA: Open-Vocabulary Robotic Manipulation through Mark-Based Visual Prompting はコメントを受け付けていません

Codebook-enabled Generative End-to-end Semantic Communication Powered by Transformer

要約 コードブックが送信機と受信機間で共有される場合、送信する必要があるのはイン … 続きを読む

カテゴリー: cs.AI, cs.IT, math.IT | Codebook-enabled Generative End-to-end Semantic Communication Powered by Transformer はコメントを受け付けていません

A Prefrontal Cortex-inspired Architecture for Planning in Large Language Models

要約 大規模言語モデル (LLM) は、さまざまなタスクで優れたパフォーマンスを … 続きを読む

カテゴリー: cs.AI, cs.NE | A Prefrontal Cortex-inspired Architecture for Planning in Large Language Models はコメントを受け付けていません

Unifying and Certifying Top-Quality Planning

要約 実際のシナリオで計画ツールの利用が増えているため、複数の高品質な計画を作成 … 続きを読む

カテゴリー: cs.AI | Unifying and Certifying Top-Quality Planning はコメントを受け付けていません

Behavior Generation with Latent Actions

要約 ラベル付きデータセットからの複雑な動作の生成モデリングは、意思決定における … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Behavior Generation with Latent Actions はコメントを受け付けていません

How Well Can Transformers Emulate In-context Newton’s Method?

要約 トランスフォーマーベースのモデルは、優れたコンテキスト内学習機能を実証して … 続きを読む

カテゴリー: cs.AI, cs.LG, math.OC, stat.ML | How Well Can Transformers Emulate In-context Newton’s Method? はコメントを受け付けていません

Preventing Reward Hacking with Occupancy Measure Regularization

要約 報酬ハッキングは、エージェントが「プロキシ」報酬関数 (手動で指定または学 … 続きを読む

カテゴリー: cs.AI, cs.LG | Preventing Reward Hacking with Occupancy Measure Regularization はコメントを受け付けていません

Towards General Computer Control: A Multimodal Agent for Red Dead Redemption II as a Case Study

要約 最近の研究では、特定のタスクやシナリオにおける財団エージェントの成功が実証 … 続きを読む

カテゴリー: cs.AI | Towards General Computer Control: A Multimodal Agent for Red Dead Redemption II as a Case Study はコメントを受け付けていません

Reliable, Adaptable, and Attributable Language Models with Retrieval

要約 膨大な量の Web データでトレーニングされたパラメトリック言語モデル ( … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Reliable, Adaptable, and Attributable Language Models with Retrieval はコメントを受け付けていません