cs.AI」カテゴリーアーカイブ

A Pattern to Align Them All: Integrating Different Modalities to Define Multi-Modal Entities

要約 さまざまな感覚入力を推論し、統合する能力は人間の知性を支える基礎であり、ナ … 続きを読む

カテゴリー: cs.AI | A Pattern to Align Them All: Integrating Different Modalities to Define Multi-Modal Entities はコメントを受け付けていません

Many-Shot In-Context Learning

要約 大規模言語モデル (LLM) は、重みの更新を行わずに、推論時にコンテキス … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Many-Shot In-Context Learning はコメントを受け付けていません

Guided Reinforcement Learning for Robust Multi-Contact Loco-Manipulation

要約 強化学習 (RL) では、多くの場合、各タスクに合わせた綿密なマルコフ決定 … 続きを読む

カテゴリー: cs.AI, cs.RO | Guided Reinforcement Learning for Robust Multi-Contact Loco-Manipulation はコメントを受け付けていません

Artificial Kuramoto Oscillatory Neurons

要約 神経科学と AI の両方において、ニューロン間の「結合」が、ネットワークの … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | Artificial Kuramoto Oscillatory Neurons はコメントを受け付けていません

Generalization-baed similarity

要約 一見遠くに見える物体の類似点を検出し利用することは、間違いなく人間の重要な … 続きを読む

カテゴリー: cs.AI, cs.LO | Generalization-baed similarity はコメントを受け付けていません

AgentOccam: A Simple Yet Strong Baseline for LLM-Based Web Agents

要約 パーソナライズされ標準化されたタスクに大規模言語モデル (LLM) を使用 … 続きを読む

カテゴリー: cs.AI, cs.CL | AgentOccam: A Simple Yet Strong Baseline for LLM-Based Web Agents はコメントを受け付けていません

Retrieval Augmented Generation or Long-Context LLMs? A Comprehensive Study and Hybrid Approach

要約 検索拡張生成 (RAG) は、大規模言語モデル (LLM) が長すぎるコン … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Retrieval Augmented Generation or Long-Context LLMs? A Comprehensive Study and Hybrid Approach はコメントを受け付けていません

A Common Pitfall of Margin-based Language Model Alignment: Gradient Entanglement

要約 ヒューマン フィードバックからの強化学習 (RLHF) は、言語モデル ( … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | A Common Pitfall of Margin-based Language Model Alignment: Gradient Entanglement はコメントを受け付けていません

The Disparate Benefits of Deep Ensembles

要約 ディープ ニューラル ネットワークのアンサンブルであるディープ アンサンブ … 続きを読む

カテゴリー: cs.AI, cs.LG | The Disparate Benefits of Deep Ensembles はコメントを受け付けていません

ORSO: Accelerating Reward Design via Online Reward Selection and Policy Optimization

要約 報酬形成は強化学習 (RL) の重要な要素であり、特に報酬がまばらであると … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | ORSO: Accelerating Reward Design via Online Reward Selection and Policy Optimization はコメントを受け付けていません