cs.CL」カテゴリーアーカイブ

Optimizing Contextual Speech Recognition Using Vector Quantization for Efficient Retrieval

要約 ニューラル コンテキスト バイアスにより、音声認識モデルがコンテキストに関 … 続きを読む

カテゴリー: cs.CL, eess.AS | Optimizing Contextual Speech Recognition Using Vector Quantization for Efficient Retrieval はコメントを受け付けていません

The LLM Language Network: A Neuroscientific Approach for Identifying Causally Task-Relevant Units

要約 大規模言語モデル (LLM) は、言語タスクだけでなく、論理的推論や社会的 … 続きを読む

カテゴリー: cs.CL, cs.LG | The LLM Language Network: A Neuroscientific Approach for Identifying Causally Task-Relevant Units はコメントを受け付けていません

MdEval: Massively Multilingual Code Debugging

要約 コード大規模言語モデル (LLM) は、バグのあるコード スニペットに基づ … 続きを読む

カテゴリー: cs.CL | MdEval: Massively Multilingual Code Debugging はコメントを受け付けていません

LLM-Ref: Enhancing Reference Handling in Technical Writing with Large Language Models

要約 大規模言語モデル (LLM) はデータ合成には優れていますが、ドメイン固有 … 続きを読む

カテゴリー: cs.CL, I.2.7 | LLM-Ref: Enhancing Reference Handling in Technical Writing with Large Language Models はコメントを受け付けていません

Sparsing Law: Towards Large Language Models with Greater Activation Sparsity

要約 アクティベーションの希薄性は、アクティベーション出力内に、除去できる寄与度 … 続きを読む

カテゴリー: cs.CL, cs.LG, I.2.7, stat.ML | Sparsing Law: Towards Large Language Models with Greater Activation Sparsity はコメントを受け付けていません

WebRL: Training LLM Web Agents via Self-Evolving Online Curriculum Reinforcement Learning

要約 大規模言語モデル (LLM) は、特に Web ベースのタスクにおいて自律 … 続きを読む

カテゴリー: cs.CL | WebRL: Training LLM Web Agents via Self-Evolving Online Curriculum Reinforcement Learning はコメントを受け付けていません

Seq-VCR: Preventing Collapse in Intermediate Transformer Representations for Enhanced Reasoning

要約 デコーダーのみのトランスフォーマーは、複雑な推論タスク、特に複数の連続操作 … 続きを読む

カテゴリー: cs.CL, cs.LG | Seq-VCR: Preventing Collapse in Intermediate Transformer Representations for Enhanced Reasoning はコメントを受け付けていません

AmbigNLG: Addressing Task Ambiguity in Instruction for NLG

要約 自然言語生成 (NLG) の命令におけるタスクの曖昧さの課題に取り組むため … 続きを読む

カテゴリー: cs.CL | AmbigNLG: Addressing Task Ambiguity in Instruction for NLG はコメントを受け付けていません

Attacking Vision-Language Computer Agents via Pop-ups

要約 大規模ビジョンおよび言語モデル (VLM) を活用した自律型エージェントは … 続きを読む

カテゴリー: cs.CL | Attacking Vision-Language Computer Agents via Pop-ups はコメントを受け付けていません

Tool Learning with Large Language Models: A Survey

要約 最近、大規模言語モデル (LLM) を使用したツール学習が、LLM の機能 … 続きを読む

カテゴリー: cs.AI, cs.CL | Tool Learning with Large Language Models: A Survey はコメントを受け付けていません