「cs.AI」カテゴリーアーカイブ

A Pattern to Align Them All: Integrating Different Modalities to Define Multi-Modal Entities

投稿日: 2024年10月18日作成者: jarxiv

要約さまざまな感覚入力を推論し、統合する能力は人間の知性を支える基礎であり、ナ … 続きを読む →

カテゴリー: cs.AI | コメントを受け付けていません

Many-Shot In-Context Learning

投稿日: 2024年10月18日作成者: jarxiv

要約大規模言語モデル (LLM) は、重みの更新を行わずに、推論時にコンテキス … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Guided Reinforcement Learning for Robust Multi-Contact Loco-Manipulation

投稿日: 2024年10月18日作成者: jarxiv

要約強化学習 (RL) では、多くの場合、各タスクに合わせた綿密なマルコフ決定 … 続きを読む →

カテゴリー: cs.AI, cs.RO | コメントを受け付けていません

Artificial Kuramoto Oscillatory Neurons

投稿日: 2024年10月18日作成者: jarxiv

要約神経科学と AI の両方において、ニューロン間の「結合」が、ネットワークの … 続きを読む →

カテゴリー: cs.AI, cs.LG, stat.ML | コメントを受け付けていません

Generalization-baed similarity

投稿日: 2024年10月18日作成者: jarxiv

要約一見遠くに見える物体の類似点を検出し利用することは、間違いなく人間の重要な … 続きを読む →

カテゴリー: cs.AI, cs.LO | コメントを受け付けていません

AgentOccam: A Simple Yet Strong Baseline for LLM-Based Web Agents

投稿日: 2024年10月18日作成者: jarxiv

要約パーソナライズされ標準化されたタスクに大規模言語モデル (LLM) を使用 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Retrieval Augmented Generation or Long-Context LLMs? A Comprehensive Study and Hybrid Approach

投稿日: 2024年10月18日作成者: jarxiv

要約検索拡張生成 (RAG) は、大規模言語モデル (LLM) が長すぎるコン … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

A Common Pitfall of Margin-based Language Model Alignment: Gradient Entanglement

投稿日: 2024年10月18日作成者: jarxiv

要約ヒューマンフィードバックからの強化学習 (RLHF) は、言語モデル ( … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

The Disparate Benefits of Deep Ensembles

投稿日: 2024年10月18日作成者: jarxiv

要約ディープニューラルネットワークのアンサンブルであるディープアンサンブ … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

ORSO: Accelerating Reward Design via Online Reward Selection and Policy Optimization

投稿日: 2024年10月18日作成者: jarxiv

要約報酬形成は強化学習 (RL) の重要な要素であり、特に報酬がまばらであると … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

A Pattern to Align Them All: Integrating Different Modalities to Define Multi-Modal Entities

Many-Shot In-Context Learning

Guided Reinforcement Learning for Robust Multi-Contact Loco-Manipulation

Artificial Kuramoto Oscillatory Neurons

Generalization-baed similarity

AgentOccam: A Simple Yet Strong Baseline for LLM-Based Web Agents

Retrieval Augmented Generation or Long-Context LLMs? A Comprehensive Study and Hybrid Approach

A Common Pitfall of Margin-based Language Model Alignment: Gradient Entanglement

The Disparate Benefits of Deep Ensembles

ORSO: Accelerating Reward Design via Online Reward Selection and Policy Optimization

最近の投稿

最近のコメント

アーカイブ

カテゴリー