月別アーカイブ: 2024年6月

When Parts are Greater Than Sums: Individual LLM Components Can Outperform Full Models

要約 この論文では、大規模な言語モデルの出力をアテンション ヘッドと MLP ( … 続きを読む

カテゴリー: cs.CL | When Parts are Greater Than Sums: Individual LLM Components Can Outperform Full Models はコメントを受け付けていません

Venturing into Uncharted Waters: The Navigation Compass from Transformer to Mamba

要約 ディープ ニューラル ネットワーク アーキテクチャである Transfor … 続きを読む

カテゴリー: cs.CL | Venturing into Uncharted Waters: The Navigation Compass from Transformer to Mamba はコメントを受け付けていません

Children’s Speech Recognition through Discrete Token Enhancement

要約 子供の音声認識は、主に公的に利用可能なデータが不足しているため、リソースが … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Children’s Speech Recognition through Discrete Token Enhancement はコメントを受け付けていません

CLIMATELI: Evaluating Entity Linking on Climate Change Data

要約 気候変動 (CC) は世界的に重要な差し迫ったテーマであり、社会科学から自 … 続きを読む

カテゴリー: cs.CL | CLIMATELI: Evaluating Entity Linking on Climate Change Data はコメントを受け付けていません

Adversarial Contrastive Decoding: Boosting Safety Alignment of Large Language Models via Opposite Prompt Optimization

要約 大規模言語モデル (LLM) が広く適用されるようになったことで、その安全 … 続きを読む

カテゴリー: cs.CL | Adversarial Contrastive Decoding: Boosting Safety Alignment of Large Language Models via Opposite Prompt Optimization はコメントを受け付けていません

Sparser is Faster and Less is More: Efficient Sparse Attention for Long-Range Transformers

要約 自己回帰トランスフォーマー、特に拡張コンテキスト ウィンドウ内で長いシーケ … 続きを読む

カテゴリー: cs.CL, cs.LG | Sparser is Faster and Less is More: Efficient Sparse Attention for Long-Range Transformers はコメントを受け付けていません

OCALM: Object-Centric Assessment with Language Models

要約 報酬信号を適切に定義して強化学習 (RL) エージェントを効率的にトレーニ … 続きを読む

カテゴリー: cs.CL, cs.LG | OCALM: Object-Centric Assessment with Language Models はコメントを受け付けていません

Towards Zero-Shot Text-To-Speech for Arabic Dialects

要約 ゼロショット マルチスピーカー テキスト読み上げ (ZS-TTS) システ … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Towards Zero-Shot Text-To-Speech for Arabic Dialects はコメントを受け付けていません

Can Many-Shot In-Context Learning Help Long-Context LLM Judges? See More, Judge Better!

要約 大規模言語モデル (LLM) のパフォーマンスを評価するための判断材料とし … 続きを読む

カテゴリー: cs.CL | Can Many-Shot In-Context Learning Help Long-Context LLM Judges? See More, Judge Better! はコメントを受け付けていません

Towards Fast Multilingual LLM Inference: Speculative Decoding and Specialized Drafters

要約 大規模言語モデル (LLM) は自然言語処理に革命をもたらし、その適用範囲 … 続きを読む

カテゴリー: cs.CL | Towards Fast Multilingual LLM Inference: Speculative Decoding and Specialized Drafters はコメントを受け付けていません