cs.CL」カテゴリーアーカイブ

I Don’t Know: Explicit Modeling of Uncertainty with an [IDK] Token

要約 大規模言語モデルは現実世界の知識を捕捉し、多くの下流タスクで優れた能力を発 … 続きを読む

カテゴリー: cs.CL, cs.LG | I Don’t Know: Explicit Modeling of Uncertainty with an [IDK] Token はコメントを受け付けていません

AutoDCWorkflow: LLM-based Data Cleaning Workflow Auto-Generation and Benchmark

要約 データ クリーニング ワークフローを自動生成するための大規模言語モデル ( … 続きを読む

カテゴリー: cs.CL, cs.DB | AutoDCWorkflow: LLM-based Data Cleaning Workflow Auto-Generation and Benchmark はコメントを受け付けていません

How Many Languages Make Good Multilingual Instruction Tuning? A Case Study on BLOOM

要約 複数の言語を使用して大規模な言語モデルを命令チューニングすることで、多言語 … 続きを読む

カテゴリー: cs.CL | How Many Languages Make Good Multilingual Instruction Tuning? A Case Study on BLOOM はコメントを受け付けていません

JAPAGEN: Efficient Few/Zero-shot Learning via Japanese Training Dataset Generation with LLM

要約 最近のいくつかの研究では、教師ありトレーニング データの効果的なジェネレー … 続きを読む

カテゴリー: cs.CL | JAPAGEN: Efficient Few/Zero-shot Learning via Japanese Training Dataset Generation with LLM はコメントを受け付けていません

The broader spectrum of in-context learning

要約 文脈内のいくつかの例からタスクを学習する言語モデルの機能は、大きな関心を集 … 続きを読む

カテゴリー: cs.CL, cs.LG | The broader spectrum of in-context learning はコメントを受け付けていません

Refusal Tokens: A Simple Way to Calibrate Refusals in Large Language Models

要約 安全で信頼性の高い言語モデルを構築するための重要な要素は、モデルが特定の指 … 続きを読む

カテゴリー: cs.CL, cs.LG | Refusal Tokens: A Simple Way to Calibrate Refusals in Large Language Models はコメントを受け付けていません

Training Large Language Models to Reason in a Continuous Latent Space

要約 大規模言語モデル (LLM) は、「言語空間」での推論に限定されており、通 … 続きを読む

カテゴリー: cs.CL | Training Large Language Models to Reason in a Continuous Latent Space はコメントを受け付けていません

ProcessBench: Identifying Process Errors in Mathematical Reasoning

要約 言語モデルは数学の問題を解くときに定期的に間違いを犯すため、推論プロセスに … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | ProcessBench: Identifying Process Errors in Mathematical Reasoning はコメントを受け付けていません

Improving the Efficiency of Visually Augmented Language Models

要約 自己回帰言語モデル (LM) の優れたパフォーマンスにもかかわらず、報告バ … 続きを読む

カテゴリー: cs.AI, cs.CL | Improving the Efficiency of Visually Augmented Language Models はコメントを受け付けていません

CIC: A Framework for Culturally-Aware Image Captioning

要約 画像キャプションは、BLIP などの視覚言語事前学習モデル (VLP) を … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | CIC: A Framework for Culturally-Aware Image Captioning はコメントを受け付けていません