-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CL」カテゴリーアーカイブ
Reinforcement Learning Outperforms Supervised Fine-Tuning: A Case Study on Audio Question Answering
要約 最近、強化学習(RL)は、大規模な言語モデル(LLM)の推論能力を大幅に強 … 続きを読む
Probabilities of Chat LLMs Are Miscalibrated but Still Predict Correctness on Multiple-Choice Q&A
要約 チャット用に微調整された15の大手言語モデル(LLM)を研究し、最大のソフ … 続きを読む
VenusFactory: A Unified Platform for Protein Engineering Data Retrieval and Language Model Fine-Tuning
要約 自然言語加工(NLP)は、事前に訓練されたタンパク質言語モデル(PLMS) … 続きを読む
From 1,000,000 Users to Every User: Scaling Up Personalized Preference for User-level Alignment
要約 大規模な言語モデル(LLM)は、ユーザーの価値とニーズの多様性を根本的に見 … 続きを読む
Dynamic Bi-Elman Attention Networks (DBEAN): Dual-Directional Context-Aware Representation Learning for Enhanced Text Classification
要約 自然言語処理(NLP)の基本的なタスクであるテキスト分類は、テキストデータ … 続きを読む
What Makes a Reward Model a Good Teacher? An Optimization Perspective
要約 人間のフィードバック(RLHF)からの強化学習の成功は、報酬モデルの品質に … 続きを読む
Value Profiles for Encoding Human Variation
要約 評価タスクにおける人間の変動のモデリングは、パーソナライズ、多元的モデルア … 続きを読む
SemEval-2025 Task 1: AdMIRe — Advancing Multimodal Idiomaticity Representation
要約 慣用的な表現は、NLPにユニークな課題を提示します。その意味は、構成要素の … 続きを読む
Safety at Scale: A Comprehensive Survey of Large Model Safety
要約 大規模な事前トレーニングによる学習と一般化における並外れた能力によって推進 … 続きを読む