cs.CL」カテゴリーアーカイブ

LLM Braces: Straightening Out LLM Predictions with Relevant Sub-Updates

要約 最近の発見は、変圧器ベースの大手言語モデル(LLM)の知識の多くがそのフィ … 続きを読む

カテゴリー: cs.CL | LLM Braces: Straightening Out LLM Predictions with Relevant Sub-Updates はコメントを受け付けていません

Seq-VCR: Preventing Collapse in Intermediate Transformer Representations for Enhanced Reasoning

要約 デコーダーのみのトランスフォーマーは、多くの場合、複雑な推論タスク、特に複 … 続きを読む

カテゴリー: cs.CL, cs.LG | Seq-VCR: Preventing Collapse in Intermediate Transformer Representations for Enhanced Reasoning はコメントを受け付けていません

Masked Mixers for Language Generation and Retrieval

要約 入力要素の厳密なサブセットに選択的に焦点を当てる注意メカニズムは、今日の言 … 続きを読む

カテゴリー: cs.CL, cs.LG | Masked Mixers for Language Generation and Retrieval はコメントを受け付けていません

Stop Overthinking: A Survey on Efficient Reasoning for Large Language Models

要約 大規模な言語モデル(LLM)は、複雑なタスクで顕著な能力を示しています。 … 続きを読む

カテゴリー: cs.CL | Stop Overthinking: A Survey on Efficient Reasoning for Large Language Models はコメントを受け付けていません

‘Moralized’ Multi-Step Jailbreak Prompts: Black-Box Testing of Guardrails in Large Language Models for Verbal Attacks

要約 大規模な言語モデルの適用がさまざまな分野で拡大し続けるにつれて、有害なコン … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR | ‘Moralized’ Multi-Step Jailbreak Prompts: Black-Box Testing of Guardrails in Large Language Models for Verbal Attacks はコメントを受け付けていません

MathFusion: Enhancing Mathematic Problem-solving of LLM through Instruction Fusion

要約 大規模な言語モデル(LLM)は、数学的推論において印象的な進歩を示していま … 続きを読む

カテゴリー: cs.AI, cs.CL | MathFusion: Enhancing Mathematic Problem-solving of LLM through Instruction Fusion はコメントを受け付けていません

JuDGE: Benchmarking Judgment Document Generation for Chinese Legal System

要約 このペーパーでは、中国の法制度における判断文書生成のパフォーマンスを評価す … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR | JuDGE: Benchmarking Judgment Document Generation for Chinese Legal System はコメントを受け付けていません

When Text Embedding Meets Large Language Model: A Comprehensive Survey

要約 テキストの埋め込みは、深い学習時代に自然言語処理(NLP)の基礎技術となっ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR | When Text Embedding Meets Large Language Model: A Comprehensive Survey はコメントを受け付けていません

LLM-SR: Scientific Equation Discovery via Programming with Large Language Models

要約 数学的方程式は、さまざまな科学分野で複雑な自然現象を説明するのに不当に効果 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.NE | LLM-SR: Scientific Equation Discovery via Programming with Large Language Models はコメントを受け付けていません

LegalCore: A Dataset for Event Coreference Resolution in Legal Documents

要約 ドキュメントでのイベントとそれらのコアファレンスの言及を認識することは、テ … 続きを読む

カテゴリー: cs.AI, cs.CL | LegalCore: A Dataset for Event Coreference Resolution in Legal Documents はコメントを受け付けていません