cs.CL」カテゴリーアーカイブ

VerAs: Verify then Assess STEM Lab Reports

要約 STEM 教育では批判的思考スキルにますます重点が置かれているため、探究ス … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | VerAs: Verify then Assess STEM Lab Reports はコメントを受け付けていません

Layer Skip: Enabling Early Exit Inference and Self-Speculative Decoding

要約 大規模言語モデル (LLM) の推論を高速化するエンドツーエンドのソリュー … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Layer Skip: Enabling Early Exit Inference and Self-Speculative Decoding はコメントを受け付けていません

Gemini 1.5: Unlocking multimodal understanding across millions of tokens of context

要約 このレポートでは、Gemini ファミリの最新モデルである Gemini … 続きを読む

カテゴリー: cs.AI, cs.CL | Gemini 1.5: Unlocking multimodal understanding across millions of tokens of context はコメントを受け付けていません

Automatic Speech Recognition System-Independent Word Error Rate Estimatio

要約 単語誤り率 (WER) は、自動音声認識 (ASR) システムによって生成 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Automatic Speech Recognition System-Independent Word Error Rate Estimatio はコメントを受け付けていません

Dataset of Quotation Attribution in German News Articles

要約 誰が誰に何を言ったかを抽出することは、オンライン ニュース記事などの今日の … 続きを読む

カテゴリー: cs.CL | Dataset of Quotation Attribution in German News Articles はコメントを受け付けていません

Prefix Text as a Yarn: Eliciting Non-English Alignment in Foundation Language Model

要約 教師あり微調整 (SFT) は、基盤となる大規模言語モデル (LLM) の … 続きを読む

カテゴリー: cs.AI, cs.CL | Prefix Text as a Yarn: Eliciting Non-English Alignment in Foundation Language Model はコメントを受け付けていません

REBEL: Reinforcement Learning via Regressing Relative Rewards

要約 近接ポリシー最適化 (PPO) は、もともと連続制御問題のために開発されま … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | REBEL: Reinforcement Learning via Regressing Relative Rewards はコメントを受け付けていません

Modeling Selective Feature Attention for Representation-based Siamese Text Matching

要約 表現ベースのシャム ネットワークは、導入コストと推論コストが低いため、軽量 … 続きを読む

カテゴリー: cs.CL | Modeling Selective Feature Attention for Representation-based Siamese Text Matching はコメントを受け付けていません

Continual Learning of Large Language Models: A Comprehensive Survey

要約 事前に収集された静的な一般的なデータセットでトレーニングされた大規模言語モ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Continual Learning of Large Language Models: A Comprehensive Survey はコメントを受け付けていません

Weak-to-Strong Extrapolation Expedites Alignment

要約 大規模言語モデル (LLM) の機能は、理想的にはデータとコンピューティン … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Weak-to-Strong Extrapolation Expedites Alignment はコメントを受け付けていません