月別アーカイブ: 2024年3月

Reaching Consensus in Cooperative Multi-Agent Reinforcement Learning with Goal Imagination

投稿日: 2024年3月6日作成者: jarxiv

要約コンセンサスに達することが、複数のエージェントの調整の鍵となります。協力 … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

MOKA: Open-Vocabulary Robotic Manipulation through Mark-Based Visual Prompting

投稿日: 2024年3月6日作成者: jarxiv

要約オープンな語彙の一般化には、複雑で多様な環境とタスクの目標を伴うタスクを実 … 続きを読む →

カテゴリー: cs.AI, cs.RO | コメントを受け付けていません

Codebook-enabled Generative End-to-end Semantic Communication Powered by Transformer

投稿日: 2024年3月6日作成者: jarxiv

要約コードブックが送信機と受信機間で共有される場合、送信する必要があるのはイン … 続きを読む →

カテゴリー: cs.AI, cs.IT, math.IT | コメントを受け付けていません

A Prefrontal Cortex-inspired Architecture for Planning in Large Language Models

投稿日: 2024年3月6日作成者: jarxiv

要約大規模言語モデル (LLM) は、さまざまなタスクで優れたパフォーマンスを … 続きを読む →

カテゴリー: cs.AI, cs.NE | コメントを受け付けていません

Unifying and Certifying Top-Quality Planning

投稿日: 2024年3月6日作成者: jarxiv

要約実際のシナリオで計画ツールの利用が増えているため、複数の高品質な計画を作成 … 続きを読む →

カテゴリー: cs.AI | コメントを受け付けていません

Behavior Generation with Latent Actions

投稿日: 2024年3月6日作成者: jarxiv

要約ラベル付きデータセットからの複雑な動作の生成モデリングは、意思決定における … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO | コメントを受け付けていません

How Well Can Transformers Emulate In-context Newton’s Method?

投稿日: 2024年3月6日作成者: jarxiv

要約トランスフォーマーベースのモデルは、優れたコンテキスト内学習機能を実証して … 続きを読む →

カテゴリー: cs.AI, cs.LG, math.OC, stat.ML | コメントを受け付けていません

Preventing Reward Hacking with Occupancy Measure Regularization

投稿日: 2024年3月6日作成者: jarxiv

要約報酬ハッキングは、エージェントが「プロキシ」報酬関数 (手動で指定または学 … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Towards General Computer Control: A Multimodal Agent for Red Dead Redemption II as a Case Study

投稿日: 2024年3月6日作成者: jarxiv

要約最近の研究では、特定のタスクやシナリオにおける財団エージェントの成功が実証 … 続きを読む →

カテゴリー: cs.AI | コメントを受け付けていません

Reliable, Adaptable, and Attributable Language Models with Retrieval

投稿日: 2024年3月6日作成者: jarxiv

要約膨大な量の Web データでトレーニングされたパラメトリック言語モデル ( … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

月別アーカイブ: 2024年3月

Reaching Consensus in Cooperative Multi-Agent Reinforcement Learning with Goal Imagination

MOKA: Open-Vocabulary Robotic Manipulation through Mark-Based Visual Prompting

Codebook-enabled Generative End-to-end Semantic Communication Powered by Transformer

A Prefrontal Cortex-inspired Architecture for Planning in Large Language Models

Unifying and Certifying Top-Quality Planning

Behavior Generation with Latent Actions

How Well Can Transformers Emulate In-context Newton’s Method?

Preventing Reward Hacking with Occupancy Measure Regularization

Towards General Computer Control: A Multimodal Agent for Red Dead Redemption II as a Case Study

Reliable, Adaptable, and Attributable Language Models with Retrieval

最近の投稿

最近のコメント

アーカイブ

カテゴリー