-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年2月
Better Slow than Sorry: Introducing Positive Friction for Reliable Dialogue Systems
要約 談話と認知科学の理論は、ゆったりとしたペーシングの価値を長い間認識してきま … 続きを読む
SafetyAnalyst: Interpretable, transparent, and steerable safety moderation for AI behavior
要約 理想的なAIの安全性節度システムは、構造的に解釈可能であり(そのため、その … 続きを読む
GPT-4o as the Gold Standard: A Scalable and General Purpose Approach to Filter Language Model Pretraining Data
要約 大規模な言語モデルには膨大な量の高品質のトレーニングデータが必要ですが、W … 続きを読む
SELMA: A Speech-Enabled Language Model for Virtual Assistant Interactions
要約 この作業では、オーディオとテキストを大規模な言語モデル(LLM)に統合する … 続きを読む
TableMaster: A Recipe to Advance Table Understanding with Language Models
要約 テーブルは、構造化されたリレーショナルデータを表すための基本形式として機能 … 続きを読む
カテゴリー: cs.CL
TableMaster: A Recipe to Advance Table Understanding with Language Models はコメントを受け付けていません
Diverse Preference Optimization
要約 補強学習、好みの最適化、または監視された微調整のいずれかを通じて、言語モデ … 続きを読む
カテゴリー: cs.CL
Diverse Preference Optimization はコメントを受け付けていません
Strassen Attention: Unlocking Compositional Abilities in Transformers Based on a New Lower Bound Method
要約 変圧器の理論的な制限を評価するための新しい方法を提案し、無限の精度で1層ソ … 続きを読む
Sparse Autoencoders Reveal Universal Feature Spaces Across Large Language Models
要約 私たちは、大規模な言語モデル(LLMS)の特徴普遍性を調査します。これは、 … 続きを読む
A Zero-Shot Generalization Framework for LLM-Driven Cross-Domain Sequential Recommendation
要約 ゼロショットクロスドメインの順次推奨(ZCDSR)は、追加のトレーニングや … 続きを読む
Policy Gradient Methods for Risk-Sensitive Distributional Reinforcement Learning with Provable Convergence
要約 リスクに敏感な強化学習(RL)は、ハイステークスアプリケーションで信頼でき … 続きを読む