-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CL」カテゴリーアーカイブ
Harnessing Negative Signals: Reinforcement Distillation from Teacher Data for LLM Reasoning
要約 モデルの蒸留の最近の進歩は、高度な推論モデルからのデータ(例:Deepse … 続きを読む
ProRL: Prolonged Reinforcement Learning Expands Reasoning Boundaries in Large Language Models
要約 推論中心の言語モデルの最近の進歩により、強化学習(RL)は、検証可能な報酬 … 続きを読む
Draw ALL Your Imagine: A Holistic Benchmark and Agent Framework for Complex Instruction-based Image Generation
要約 テキストからイメージ(T2I)生成の最近の進歩により、モデルはテキストの説 … 続きを読む
Deep Augmentation: Dropout as Augmentation for Self-Supervised Learning
要約 ドロップアウトの機械学習における普及にもかかわらず、データ増強の形態として … 続きを読む
LegalEval-Q: A New Benchmark for The Quality Evaluation of LLM-Generated Legal Text
要約 大規模な言語モデル(LLM)が法的アプリケーションでますます使用されている … 続きを読む
Using Knowledge Graphs to harvest datasets for efficient CLIP model training
要約 高品質のクリップモデルのトレーニングには、通常、膨大なデータセットが必要で … 続きを読む
Vision LLMs Are Bad at Hierarchical Visual Understanding, and LLMs Are the Bottleneck
要約 このペーパーでは、最先端の大規模な言語モデル(LLM)が私たちの視覚的世界 … 続きを読む
MoDoMoDo: Multi-Domain Data Mixtures for Multimodal LLM Reinforcement Learning
要約 検証可能な報酬(RLVR)による強化学習は、最近、トレーニング後の大手言語 … 続きを読む
ProxyThinker: Test-Time Guidance through Small Visual Reasoners
要約 検証可能な報酬による強化学習の最近の進歩により、大規模なビジョン言語モデル … 続きを読む
ReasonGen-R1: CoT for Autoregressive Image generation models through SFT and RL
要約 考え方の推論と強化学習(RL)がNLPのブレークスルーを駆動していますが、 … 続きを読む