-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.LG」カテゴリーアーカイブ
Towards Quantifying the Hessian Structure of Neural Networks
要約 実証研究は、ニューラルネットワークのヘシアンマトリックス(NNS)が遮断に … 続きを読む
Impact of Noisy Supervision in Foundation Model Learning
要約 基礎モデルは通常、大規模なデータセットで事前に訓練されており、チューニング … 続きを読む
Almost AI, Almost Human: The Challenge of Detecting AI-Polished Writing
要約 テキスト生成のための大規模な言語モデル(LLMS)の使用の増加により、AI … 続きを読む
JTCSE: Joint Tensor-Modulus Constraints and Cross-Attention for Unsupervised Contrastive Learning of Sentence Embeddings
要約 監視されていない対照学習は、自然言語処理のホットな研究トピックになりました … 続きを読む
RM-R1: Reward Modeling as Reasoning
要約 報酬モデリングは、特に人間のフィードバック(RLHF)からの強化学習を通じ … 続きを読む
Optimizing Chain-of-Thought Reasoners via Gradient Variance Minimization in Rejection Sampling and RL
要約 大規模な言語モデル(LLMS)のチェーンオブテーブ(COT)推論は、潜在的 … 続きを読む
Unveiling the Mechanisms of Explicit CoT Training: How CoT Enhances Reasoning Generalization
要約 大規模な言語モデル(LLMS)のトレーニングへの明示的なチェーン(COT) … 続きを読む
Bielik v3 Small: Technical Report
要約 ポーランド語処理用に最適化された一連のパラメーター効率の高い生成テキストモ … 続きを読む
EMORL: Ensemble Multi-Objective Reinforcement Learning for Efficient and Flexible LLM Fine-Tuning
要約 大規模な言語モデル(LLM)の補強学習(RL)の最近の進歩は、多目的タスク … 続きを読む
APIGen-MT: Agentic Pipeline for Multi-Turn Data Generation via Simulated Agent-Human Interplay
要約 マルチターン相互作用のための効果的なAIエージェントのトレーニングには、現 … 続きを読む