「cs.CL」カテゴリーアーカイブ

On the Scaling Laws of Geographical Representation in Language Models

投稿日: 2024年3月1日作成者: jarxiv

要約言語モデルは、その隠された表現に地理情報を埋め込むことが長い間示されてきま … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Can LLMs Capture Human Preferences?

投稿日: 2024年3月1日作成者: jarxiv

要約私たちは、時間間の選択に焦点を当てて、人間の調査回答者をエミュレートし、好 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Compositional API Recommendation for Library-Oriented Code Generation

投稿日: 2024年3月1日作成者: jarxiv

要約大規模言語モデル (LLM) は、コード生成において優れたパフォーマンスを … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.SE | コメントを受け付けていません

ArCHer: Training Language Model Agents via Hierarchical Multi-Turn RL

投稿日: 2024年3月1日作成者: jarxiv

要約大規模言語モデル (LLM) の幅広い使用例は、目標指向の意思決定タスク … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Revisiting the Hypothesis: Do pretrained Transformers Learn In-Context by Gradient Descent?

投稿日: 2024年3月1日作成者: jarxiv

要約 LLM における In-Context Learning (ICL) の出 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Functional Benchmarks for Robust Evaluation of Reasoning Performance, and the Reasoning Gap

投稿日: 2024年3月1日作成者: jarxiv

要約ベンチマークの関数バリアントを使用して、言語モデルの推論能力を堅牢に評価す … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

$\texttt{COSMIC}$: Mutual Information for Task-Agnostic Summarization Evaluation

投稿日: 2024年3月1日作成者: jarxiv

要約サマライザの品質を評価することは、大きな課題を引き起こします。これに応え … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Curiosity-driven Red-teaming for Large Language Models

投稿日: 2024年3月1日作成者: jarxiv

要約大規模言語モデル (LLM) は、多くの自然言語アプリケーションにとって大 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Towards Tracing Trustworthiness Dynamics: Revisiting Pre-training Period of Large Language Models

投稿日: 2024年3月1日作成者: jarxiv

要約大規模言語モデル (LLM) の信頼性を確保することは非常に重要です。ほ … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Loose LIPS Sink Ships: Asking Questions in Battleship with Language-Informed Program Sampling

投稿日: 2024年3月1日作成者: jarxiv

要約質問は、私たちの言語の習得と、不確実性について推論するための優れた能力を組 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

On the Scaling Laws of Geographical Representation in Language Models

Can LLMs Capture Human Preferences?

Compositional API Recommendation for Library-Oriented Code Generation

ArCHer: Training Language Model Agents via Hierarchical Multi-Turn RL

Revisiting the Hypothesis: Do pretrained Transformers Learn In-Context by Gradient Descent?

Functional Benchmarks for Robust Evaluation of Reasoning Performance, and the Reasoning Gap

$\texttt{COSMIC}$: Mutual Information for Task-Agnostic Summarization Evaluation

Curiosity-driven Red-teaming for Large Language Models

Towards Tracing Trustworthiness Dynamics: Revisiting Pre-training Period of Large Language Models

Loose LIPS Sink Ships: Asking Questions in Battleship with Language-Informed Program Sampling

最近の投稿

最近のコメント

アーカイブ

カテゴリー