投稿者「jarxiv」のアーカイブ

On Training Data Influence of GPT Models

要約 生成言語モデルの急速な進歩の中で、学習データがGPTモデルの性能をどのよう … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

Tokenization Falling Short: The Curse of Tokenization

要約 言語モデルは通常、生テキストを事前に定義された語彙からサブワード識別子のシ … 続きを読む

カテゴリー: cs.CL | コメントする

Training Language Models on Synthetic Edit Sequences Improves Code Synthesis

要約 ソフトウェア・エンジニアは、主に既存のプログラムを編集してコードを書く。対 … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

SIEVE: General Purpose Data Filtering System Matching GPT-4o Accuracy at 1% the Cost

要約 特化した大規模言語モデルを作成するには、学習と微調整のために膨大な量のクリ … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

CorPipe at CRAC 2024: Predicting Zero Mentions from Raw Text

要約 CRAC 2024多言語共参照解決共有タスクの優勝作品であるCorPipe … 続きを読む

カテゴリー: cs.CL | コメントする

Erasing Conceptual Knowledge from Language Models

要約 言語モデルにおける概念消去は、従来、包括的な評価の枠組みを欠いていたため、 … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

Which questions should I answer? Salience Prediction of Inquisitive Questions

要約 探究的な質問(人が読書をする際にする、オープンエンドで好奇心主導の質問)は … 続きを読む

カテゴリー: cs.CL | コメントする

Learning from Offline Foundation Features with Tensor Augmentations

要約 LOFF-TA(Learning from Offline Foundat … 続きを読む

カテゴリー: cs.CV | コメントする

HiFiSeg: High-Frequency Information Enhanced Polyp Segmentation with Global-Local Vision Transformer

要約 様々なコンピュータビジョンタスクにおいて、Vision Transform … 続きを読む

カテゴリー: cs.CV | コメントする

A Foundation Model for the Solar Dynamics Observatory

要約 SDO-FMは、NASAの太陽観測衛星(SDO)のデータを利用した基礎モデ … 続きを読む

カテゴリー: astro-ph.SR, cs.CV | コメントする