-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.LG」カテゴリーアーカイブ
Variance reduction combining pre-experiment and in-experiment data
要約 オンライン制御実験 (A/B テスト) は、多くの企業にとってデータ主導の … 続きを読む
Linear Convergence of Diffusion Models Under the Manifold Hypothesis
要約 スコアマッチング生成モデルは、複雑な高次元データ分布からのサンプリングに成 … 続きを読む
Generative Verifiers: Reward Modeling as Next-Token Prediction
要約 検証者または報酬モデルは、大規模言語モデル (LLM) の推論パフォーマン … 続きを読む
カテゴリー: cs.LG
Generative Verifiers: Reward Modeling as Next-Token Prediction はコメントを受け付けていません
Learn Your Reference Model for Real Good Alignment
要約 大規模言語モデル (LLM) の調整のためのオフライン メソッドは直接報酬 … 続きを読む
Unintentional Unalignment: Likelihood Displacement in Direct Preference Optimization
要約 Direct Preference Optimization (DPO) … 続きを読む
Revisiting Hierarchical Text Classification: Inference and Metrics
要約 階層テキスト分類 (HTC) は、階層として編成された構造化スペース内のテ … 続きを読む
Token Erasure as a Footprint of Implicit Vocabulary Items in LLMs
要約 LLM はテキストを単語に大まかに対応するトークンのシーケンスとして処理し … 続きを読む
Science is Exploration: Computational Frontiers for Conceptual Metaphor Theory
要約 比喩はどこにでもあります。 それらは、最も洗練された詩から一見無味乾燥な学 … 続きを読む
Parameter-Efficient Fine-Tuning of State Space Models
要約 Mamba (Gu & Dao、2024) などのディープ ステ … 続きを読む
Evaluating Copyright Takedown Methods for Language Models
要約 言語モデル (LM) は、著作権で保護されている可能性のある素材を含む、多 … 続きを読む