cs.CL」カテゴリーアーカイブ

Dynamic Early Exit in Reasoning Models

要約 大規模な推論言語モデル(LRLMS)の最近の進歩は、テスト時間スケーリング … 続きを読む

カテゴリー: cs.AI, cs.CL | Dynamic Early Exit in Reasoning Models はコメントを受け付けていません

Towards Unifying Evaluation of Counterfactual Explanations: Leveraging Large Language Models for Human-Centric Assessments

要約 機械学習モデルが進化するにつれて、透明性を維持するには、より人間中心の説明 … 続きを読む

カテゴリー: cs.AI, cs.CL | Towards Unifying Evaluation of Counterfactual Explanations: Leveraging Large Language Models for Human-Centric Assessments はコメントを受け付けていません

FairTranslate: An English-French Dataset for Gender Bias Evaluation in Machine Translation by Overcoming Gender Binarity

要約 大規模な言語モデル(LLM)は、翻訳タスクのためにますます活用されています … 続きを読む

カテゴリー: cs.AI, cs.CL | FairTranslate: An English-French Dataset for Gender Bias Evaluation in Machine Translation by Overcoming Gender Binarity はコメントを受け付けていません

A Common Pitfall of Margin-based Language Model Alignment: Gradient Entanglement

要約 人間のフィードバック(RLHF)からの強化学習は、言語モデル(LM)アライ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | A Common Pitfall of Margin-based Language Model Alignment: Gradient Entanglement はコメントを受け付けていません

W-PCA Based Gradient-Free Proxy for Efficient Search of Lightweight Language Models

要約 効率的な自然言語処理(NLP)システムの需要は、軽量言語モデルの開発につな … 続きを読む

カテゴリー: cs.AI, cs.CL | W-PCA Based Gradient-Free Proxy for Efficient Search of Lightweight Language Models はコメントを受け付けていません

How Private is Your Attention? Bridging Privacy with In-Context Learning

要約 コンテキスト学習(ICL) – 推論時間HASで提供された例か … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG, stat.ML | How Private is Your Attention? Bridging Privacy with In-Context Learning はコメントを受け付けていません

CAPO: Cost-Aware Prompt Optimization

要約 大規模な言語モデル(LLM)は、単にプロンプ​​トに導かれる幅広いタスクを … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.NE, stat.ML | CAPO: Cost-Aware Prompt Optimization はコメントを受け付けていません

AlphaEdit: Null-Space Constrained Knowledge Editing for Language Models

要約 大規模な言語モデル(LLM)は、しばしば誤った知識または時代遅れの知識のた … 続きを読む

カテゴリー: cs.AI, cs.CL | AlphaEdit: Null-Space Constrained Knowledge Editing for Language Models はコメントを受け付けていません

LongMamba: Enhancing Mamba’s Long Context Capabilities via Training-Free Receptive Field Enlargement

要約 状態空間モデル(SSM)は、言語モデリングのためのトランスモデルの効率的な … 続きを読む

カテゴリー: cs.AI, cs.CL | LongMamba: Enhancing Mamba’s Long Context Capabilities via Training-Free Receptive Field Enlargement はコメントを受け付けていません

Survey of Video Diffusion Models: Foundations, Implementations, and Applications

要約 拡散モデルの最近の進歩により、ビデオ生成に革命をもたらし、従来の生成的敵対 … 続きを読む

カテゴリー: cs.CL, cs.CV | Survey of Video Diffusion Models: Foundations, Implementations, and Applications はコメントを受け付けていません