cs.CL」カテゴリーアーカイブ

On the Scaling Laws of Geographical Representation in Language Models

要約 言語モデルは、その隠された表現に地理情報を埋め込むことが長い間示されてきま … 続きを読む

カテゴリー: cs.AI, cs.CL | On the Scaling Laws of Geographical Representation in Language Models はコメントを受け付けていません

Can LLMs Capture Human Preferences?

要約 私たちは、時間間の選択に焦点を当てて、人間の調査回答者をエミュレートし、好 … 続きを読む

カテゴリー: cs.AI, cs.CL | Can LLMs Capture Human Preferences? はコメントを受け付けていません

Compositional API Recommendation for Library-Oriented Code Generation

要約 大規模言語モデル (LLM) は、コード生成において優れたパフォーマンスを … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SE | Compositional API Recommendation for Library-Oriented Code Generation はコメントを受け付けていません

ArCHer: Training Language Model Agents via Hierarchical Multi-Turn RL

要約 大規模言語モデル (LLM) の幅広い使用例は、目標指向の意思決定タスク … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | ArCHer: Training Language Model Agents via Hierarchical Multi-Turn RL はコメントを受け付けていません

Revisiting the Hypothesis: Do pretrained Transformers Learn In-Context by Gradient Descent?

要約 LLM における In-Context Learning (ICL) の出 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Revisiting the Hypothesis: Do pretrained Transformers Learn In-Context by Gradient Descent? はコメントを受け付けていません

Functional Benchmarks for Robust Evaluation of Reasoning Performance, and the Reasoning Gap

要約 ベンチマークの関数バリアントを使用して、言語モデルの推論能力を堅牢に評価す … 続きを読む

カテゴリー: cs.AI, cs.CL | Functional Benchmarks for Robust Evaluation of Reasoning Performance, and the Reasoning Gap はコメントを受け付けていません

$\texttt{COSMIC}$: Mutual Information for Task-Agnostic Summarization Evaluation

要約 サマライザの品質を評価することは、大きな課題を引き起こします。 これに応え … 続きを読む

カテゴリー: cs.AI, cs.CL | $\texttt{COSMIC}$: Mutual Information for Task-Agnostic Summarization Evaluation はコメントを受け付けていません

Curiosity-driven Red-teaming for Large Language Models

要約 大規模言語モデル (LLM) は、多くの自然言語アプリケーションにとって大 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Curiosity-driven Red-teaming for Large Language Models はコメントを受け付けていません

Towards Tracing Trustworthiness Dynamics: Revisiting Pre-training Period of Large Language Models

要約 大規模言語モデル (LLM) の信頼性を確保することは非常に重要です。 ほ … 続きを読む

カテゴリー: cs.AI, cs.CL | Towards Tracing Trustworthiness Dynamics: Revisiting Pre-training Period of Large Language Models はコメントを受け付けていません

Loose LIPS Sink Ships: Asking Questions in Battleship with Language-Informed Program Sampling

要約 質問は、私たちの言語の習得と、不確実性について推論するための優れた能力を組 … 続きを読む

カテゴリー: cs.AI, cs.CL | Loose LIPS Sink Ships: Asking Questions in Battleship with Language-Informed Program Sampling はコメントを受け付けていません