-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年3月
SpikeLLM: Scaling up Spiking Neural Network to Large Language Models via Saliency-based Spiking
要約 近年、数十億ものパラメータを持つ大規模言語モデル(LLM)が進歩し、様々な … 続きを読む
Learning Efficient Recursive Numeral Systems via Reinforcement Learning
要約 強化学習(RL)を用いることで、エージェントが人間のものに似た単純な近似的 … 続きを読む
カテゴリー: cs.CL
Learning Efficient Recursive Numeral Systems via Reinforcement Learning はコメントを受け付けていません
Subtle Errors Matter: Preference Learning via Error-injected Self-editing
要約 ラージ・ランゲージ・モデル(LLM)は、基本的な算数から高度な競技レベルの … 続きを読む
Learning to Align Multi-Faceted Evaluation: A Unified and Robust Framework
要約 大規模言語モデル(LLM)は、様々なシナリオにおける自動評価のために、ます … 続きを読む
Test-Time Compute: from System-1 Thinking to System-2 Thinking
要約 複雑な推論におけるo1モデルの顕著な性能は、テスト時間の計算スケーリングが … 続きを読む
DailyDilemmas: Revealing Value Preferences of LLMs with Quandaries of Daily Life
要約 日常生活における意思決定において、ユーザーがLLMのガイダンスを求めること … 続きを読む
Enabling Auditory Large Language Models for Automatic Speech Quality Evaluation
要約 音声品質評価では通常、平均オピニオンスコア(MOS)や話者類似度(SIM) … 続きを読む
Selected Languages are All You Need for Cross-lingual Truthfulness Transfer
要約 大規模言語モデル(Large Language Models: LLMs) … 続きを読む
カテゴリー: cs.CL
Selected Languages are All You Need for Cross-lingual Truthfulness Transfer はコメントを受け付けていません
Dynamics of Instruction Fine-Tuning for Chinese Large Language Models
要約 インストラクションチューニングは、大規模言語モデル(LLM)の一般的な知能 … 続きを読む
カテゴリー: cs.CL
Dynamics of Instruction Fine-Tuning for Chinese Large Language Models はコメントを受け付けていません
Robust Preference Optimization through Reward Model Distillation
要約 言語モデル(LM)のポストトレーニング(またはアライメント)には、嗜好アノ … 続きを読む