-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年1月
Iterative Data Smoothing: Mitigating Reward Overfitting and Overoptimization in RLHF
要約 ヒューマン フィードバックからの強化学習 (RLHF) は、言語モデルを人 … 続きを読む
Identifiability Matters: Revealing the Hidden Recoverable Condition in Unbiased Learning to Rank
要約 Unbiased Learning to Rank (ULTR) は、ユー … 続きを読む
FedFair^3: Unlocking Threefold Fairness in Federated Learning
要約 Federated Learning (FL) は、クライアントの生データ … 続きを読む
Investigating Hallucinations in Pruned Large Language Models for Abstractive Summarization
要約 抽象的な要約における生成大規模言語モデル (LLM) の優れたパフォーマン … 続きを読む
TQCompressor: improving tensor decomposition methods in neural networks via permutations
要約 テンソル分解を改善したニューラル ネットワーク モデル圧縮の新しい方法であ … 続きを読む
Learning logic programs by discovering higher-order abstractions
要約 高次のリファクタリング問題を導入します。この問題の目的は、マップ、フィルタ … 続きを読む
Zero-shot Imitation Policy via Search in Demonstration Dataset
要約 行動クローン作成では、デモンストレーションのデータセットを使用してポリシー … 続きを読む
カテゴリー: cs.AI
Zero-shot Imitation Policy via Search in Demonstration Dataset はコメントを受け付けていません
Scaling Sparse Fine-Tuning to Large Language Models
要約 大規模言語モデル (LLM) は、パラメーターの数が膨大であるため、完全に … 続きを読む
Learning to Manipulate under Limited Information
要約 社会的選択理論の古典的な結果によれば、合理的な優先投票方法は、個人に不誠実 … 続きを読む
Evaluating explainability for machine learning predictions using model-agnostic metrics
要約 人工知能 (AI) テクノロジーの急速な進歩は、ガバナンスと規制の面で多く … 続きを読む