月別アーカイブ: 2024年2月

Beyond prompt brittleness: Evaluating the reliability and consistency of political worldviews in LLMs

要約 ユビキタス システムでは大規模言語モデル (LLM) が広く使用されている … 続きを読む

カテゴリー: cs.CL, cs.CY | Beyond prompt brittleness: Evaluating the reliability and consistency of political worldviews in LLMs はコメントを受け付けていません

Anatomy of Neural Language Models

要約 生成 AI と転移学習の分野は、近年、特に自然言語処理 (NLP) の分野 … 続きを読む

カテゴリー: cs.CL, cs.LG | Anatomy of Neural Language Models はコメントを受け付けていません

Looking Right is Sometimes Right: Investigating the Capabilities of Decoder-only LLMs for Sequence Labeling

要約 マスク言語モデリング (MLM) に基づく事前トレーニング済み言語モデルは … 続きを読む

カテゴリー: cs.CL | Looking Right is Sometimes Right: Investigating the Capabilities of Decoder-only LLMs for Sequence Labeling はコメントを受け付けていません

NextLevelBERT: Investigating Masked Language Modeling with Higher-Level Representations for Long Documents

要約 (大規模な)言語モデルはここ数年で大幅に改善されましたが、基礎となる注意メ … 続きを読む

カテゴリー: cs.CL | NextLevelBERT: Investigating Masked Language Modeling with Higher-Level Representations for Long Documents はコメントを受け付けていません

Advancing Translation Preference Modeling with RLHF: A Step Towards Cost-Effective Solution

要約 機械翻訳では、忠実さ、表現力、優雅さが常に追求されています。 ただし、 \ … 続きを読む

カテゴリー: cs.CL, cs.LG | Advancing Translation Preference Modeling with RLHF: A Step Towards Cost-Effective Solution はコメントを受け付けていません

RAVEL: Evaluating Interpretability Methods on Disentangling Language Model Representations

要約 個々のニューロンは、複数の高レベルの概念の表現に参加します。 さまざまな解 … 続きを読む

カテゴリー: cs.CL, cs.LG | RAVEL: Evaluating Interpretability Methods on Disentangling Language Model Representations はコメントを受け付けていません

AmbigNLG: Addressing Task Ambiguity in Instruction for NLG

要約 この研究では、自然言語生成 (NLG) タスクの命令におけるタスクの曖昧さ … 続きを読む

カテゴリー: cs.CL | AmbigNLG: Addressing Task Ambiguity in Instruction for NLG はコメントを受け付けていません

Tower: An Open Multilingual Large Language Model for Translation-Related Tasks

要約 汎用大規模言語モデル (LLM) は、翻訳分野内の複数のタスクに習熟してい … 続きを読む

カテゴリー: cs.CL | Tower: An Open Multilingual Large Language Model for Translation-Related Tasks はコメントを受け付けていません

Towards Optimal Learning of Language Models

要約 この研究では、優れたパフォーマンスを達成するために必要なトレーニング手順を … 続きを読む

カテゴリー: cs.CL | Towards Optimal Learning of Language Models はコメントを受け付けていません

Massive Activations in Large Language Models

要約 大規模言語モデル (LLM) では経験的な現象が観察されています。ごく少数 … 続きを読む

カテゴリー: cs.CL, cs.LG | Massive Activations in Large Language Models はコメントを受け付けていません