-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
TTPA: Token-level Tool-use Preference Alignment Training Framework with Fine-grained Evaluation
要約 既存のツール学習方法は通常、監視された微調整に依存しており、多くの場合、内 … 続きを読む
カテゴリー: cs.CL
TTPA: Token-level Tool-use Preference Alignment Training Framework with Fine-grained Evaluation はコメントを受け付けていません
Training LLM-Based Agents with Synthetic Self-Reflected Trajectories and Partial Masking
要約 環境を知覚し、目標を達成するための行動をとる自律エージェントは、大規模な言 … 続きを読む
カテゴリー: cs.CL
Training LLM-Based Agents with Synthetic Self-Reflected Trajectories and Partial Masking はコメントを受け付けていません
Uncertainty-Aware Attention Heads: Efficient Unsupervised Uncertainty Quantification for LLMs
要約 大規模な言語モデル(LLM)は印象的な流encyさを示しますが、多くの場合 … 続きを読む
カテゴリー: cs.CL
Uncertainty-Aware Attention Heads: Efficient Unsupervised Uncertainty Quantification for LLMs はコメントを受け付けていません
REARANK: Reasoning Re-ranking Agent via Reinforcement Learning
要約 大規模な言語モデル(LLM)ベースのListWise Reasoning … 続きを読む
The Many Challenges of Human-Like Agents in Virtual Game Environments
要約 人間のようなエージェントは、ゲームやそれ以降のますます重要なトピックです。 … 続きを読む
ProcessBench: Identifying Process Errors in Mathematical Reasoning
要約 言語モデルは数学の問題を解決する際に定期的に間違いを犯すため、推論プロセス … 続きを読む
Gradient Inversion Transcript: Leveraging Robust Generative Priors to Reconstruct Training Data from Gradient Leakage
要約 リークされた勾配からトレーニングデータを再構築するための新しい生成アプロー … 続きを読む
Multi-modal brain encoding models for multi-modal stimuli
要約 画像やサイレントビデオを視聴するなどの単峰性刺激に従事している参加者にもか … 続きを読む
Correlating instruction-tuning (in multimodal models) with vision-language processing (in the brain)
要約 トランスベースの言語モデルは、脳の記録を模倣するために明示的に訓練されてい … 続きを読む
Multiple Descents in Deep Learning as a Sequence of Order-Chaos Transitions
要約 LSTMのトレーニングプロセス中に、テスト損失がモデルの過剰訓練後に複数回 … 続きを読む
カテゴリー: cs.AI, cs.LG, nlin.CD, physics.comp-ph
Multiple Descents in Deep Learning as a Sequence of Order-Chaos Transitions はコメントを受け付けていません