-
最近の投稿
- Grasp EveryThing (GET): 1-DoF, 3-Fingered Gripper with Tactile Sensing for Robust Grasping
- Neural Inertial Odometry from Lie Events
- Physical synchronization of soft self-oscillating limbs for fast and autonomous locomotion
- CRADMap: Applied Distributed Volumetric Mapping with 5G-Connected Multi-Robots and 4D Radar Perception
- Learning Rock Pushability on Rough Planetary Terrain
-
最近のコメント
表示できるコメントはありません。 cs.AI (38176) cs.CL (28850) cs.CV (43741) cs.HC (2915) cs.LG (43106) cs.RO (22722) cs.SY (3490) eess.IV (5071) eess.SY (3482) stat.ML (5612)
「cs.CL」カテゴリーアーカイブ
RouteNator: A Router-Based Multi-Modal Architecture for Generating Synthetic Training Data for Function Calling LLMs
要約 このペーパーでは、実際のユーザーインタラクションデータが利用できない場合、 … 続きを読む
Disentangling Memory and Reasoning Ability in Large Language Models
要約 大規模な言語モデル(LLMS)は、広範な知識と推論能力の両方を必要とする複 … 続きを読む
The Devil Is in the Word Alignment Details: On Translation-Based Cross-Lingual Transfer for Token Classification Tasks
要約 翻訳トレインなど、翻訳を横断する転送XLTのための翻訳ベースの戦略  … 続きを読む
WorldPM: Scaling Human Preference Modeling
要約 モデルとデータセットのサイズを備えたパワー法則としてのテスト損失スケールを … 続きを読む
Beyond ‘Aha!’: Toward Systematic Meta-Abilities Alignment in Large Reasoning Models
要約 大規模な推論モデル(LRMS)は、既に長い考え方の推論のために潜在能力を持 … 続きを読む
How Does Knowledge Selection Help Retrieval Augmented Generation?
要約 検索された生成(RAG)は、外部の知識をモデルの出力に統合することにより、 … 続きを読む
Not All Adapters Matter: Selective Adapter Freezing for Memory-Efficient Fine-Tuning of Language Models
要約 トランスベースの大規模な事前訓練モデルは、大きな成功を収めています。 微調 … 続きを読む
Rethinking Repetition Problems of LLMs in Code Generation
要約 神経言語モデルの出現により、コード生成のパフォーマンスが大幅に向上しました … 続きを読む
Tokenization Matters! Degrading Large Language Models through Challenging Their Tokenization
要約 大規模な言語モデル(LLM)は、言語の理解と生成に顕著な能力を示しています … 続きを読む