-
最近の投稿
- Open-Vocabulary Action Localization with Iterative Visual Prompting
- Patterned Structure Muscle : Arbitrary Shaped Wire-driven Artificial Muscle Utilizing Anisotropic Flexible Structure for Musculoskeletal Robots
- The Power of Input: Benchmarking Zero-Shot Sim-To-Real Transfer of Reinforcement Learning Control Policies for Quadrotor Control
- PokeFlex: A Real-World Dataset of Deformable Objects for Robotics
- Toward a Better Understanding of Robot Energy Consumption in Agroecological Applications
-
最近のコメント
表示できるコメントはありません。 cs.AI (27918) cs.CL (21095) cs.CR (2183) cs.CV (34618) cs.LG (32650) cs.RO (16022) cs.SY (2484) eess.IV (4238) eess.SY (2478) stat.ML (4372)
投稿者「jarxiv」のアーカイブ
MA-RLHF: Reinforcement Learning from Human Feedback with Macro Actions
要約 人間のフィードバックからの強化学習(RLHF)は、大規模言語モデル(LLM … 続きを読む
On Training Data Influence of GPT Models
要約 生成言語モデルの急速な進歩の中で、学習データがGPTモデルの性能をどのよう … 続きを読む
Tokenization Falling Short: The Curse of Tokenization
要約 言語モデルは通常、生テキストを事前に定義された語彙からサブワード識別子のシ … 続きを読む
Training Language Models on Synthetic Edit Sequences Improves Code Synthesis
要約 ソフトウェア・エンジニアは、主に既存のプログラムを編集してコードを書く。対 … 続きを読む
SIEVE: General Purpose Data Filtering System Matching GPT-4o Accuracy at 1% the Cost
要約 特化した大規模言語モデルを作成するには、学習と微調整のために膨大な量のクリ … 続きを読む
CorPipe at CRAC 2024: Predicting Zero Mentions from Raw Text
要約 CRAC 2024多言語共参照解決共有タスクの優勝作品であるCorPipe … 続きを読む
Erasing Conceptual Knowledge from Language Models
要約 言語モデルにおける概念消去は、従来、包括的な評価の枠組みを欠いていたため、 … 続きを読む
Which questions should I answer? Salience Prediction of Inquisitive Questions
要約 探究的な質問(人が読書をする際にする、オープンエンドで好奇心主導の質問)は … 続きを読む
Learning from Offline Foundation Features with Tensor Augmentations
要約 LOFF-TA(Learning from Offline Foundat … 続きを読む