cs.CL」カテゴリーアーカイブ

Mitigating the Language Mismatch and Repetition Issues in LLM-based Machine Translation via Model Editing

要約 大規模言語モデル (LLM) は最近 NLP 分野に革命をもたらしましたが … 続きを読む

カテゴリー: cs.CL, cs.LG | Mitigating the Language Mismatch and Repetition Issues in LLM-based Machine Translation via Model Editing はコメントを受け付けていません

Predictability maximization and the origins of word order harmony

要約 私たちは、情報理論の観点から、頭部とその従属部分の順序配置に関する言語問題 … 続きを読む

カテゴリー: cs.CL, physics.soc-ph, q-bio.NC | Predictability maximization and the origins of word order harmony はコメントを受け付けていません

Data Selection via Optimal Control for Language Models

要約 この研究では、下流で使用するための LM の機能を強化するために、大量のコ … 続きを読む

カテゴリー: cs.CL | Data Selection via Optimal Control for Language Models はコメントを受け付けていません

Counterfactuals As a Means for Evaluating Faithfulness of Attribution Methods in Autoregressive Language Models

要約 自己回帰言語モデルが広く採用されているにもかかわらず、説明可能性評価の研究 … 続きを読む

カテゴリー: cs.CL | Counterfactuals As a Means for Evaluating Faithfulness of Attribution Methods in Autoregressive Language Models はコメントを受け付けていません

Not All Contexts Are Equal: Teaching LLMs Credibility-aware Generation

要約 大規模な言語モデルの急速な開発により、外部知識を統合して知識のボトルネック … 続きを読む

カテゴリー: cs.CL | Not All Contexts Are Equal: Teaching LLMs Credibility-aware Generation はコメントを受け付けていません

Stanceformer: Target-Aware Transformer for Stance Detection

要約 スタンス検出のタスクには、特定の主題またはターゲットに対するテキスト内で表 … 続きを読む

カテゴリー: cs.CL | Stanceformer: Target-Aware Transformer for Stance Detection はコメントを受け付けていません

MLE-bench: Evaluating Machine Learning Agents on Machine Learning Engineering

要約 AI エージェントが機械学習エンジニアリングでどの程度優れたパフォーマンス … 続きを読む

カテゴリー: cs.CL | MLE-bench: Evaluating Machine Learning Agents on Machine Learning Engineering はコメントを受け付けていません

Axis Tour: Word Tour Determines the Order of Axes in ICA-transformed Embeddings

要約 単語の埋め込みは自然言語処理において最も重要なコンポーネントの 1 つです … 続きを読む

カテゴリー: cs.CL | Axis Tour: Word Tour Determines the Order of Axes in ICA-transformed Embeddings はコメントを受け付けていません

Unleashing Multi-Hop Reasoning Potential in Large Language Models through Repetition of Misordered Context

要約 マルチホップ推論は、特定のコンテキスト内のサポート文書に基づいた複数ステッ … 続きを読む

カテゴリー: cs.CL | Unleashing Multi-Hop Reasoning Potential in Large Language Models through Repetition of Misordered Context はコメントを受け付けていません

Private prediction for large-scale synthetic text generation

要約 私たちは、大規模言語モデル (LLM) を使用し、プライベート予測を通じて … 続きを読む

カテゴリー: cs.CL, cs.CR, cs.LG | Private prediction for large-scale synthetic text generation はコメントを受け付けていません