「cs.CL」カテゴリーアーカイブ

I Don’t Know: Explicit Modeling of Uncertainty with an [IDK] Token

投稿日: 2024年12月10日作成者: jarxiv

要約大規模言語モデルは現実世界の知識を捕捉し、多くの下流タスクで優れた能力を発 … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

AutoDCWorkflow: LLM-based Data Cleaning Workflow Auto-Generation and Benchmark

投稿日: 2024年12月10日作成者: jarxiv

要約データクリーニングワークフローを自動生成するための大規模言語モデル ( … 続きを読む →

カテゴリー: cs.CL, cs.DB | コメントを受け付けていません

How Many Languages Make Good Multilingual Instruction Tuning? A Case Study on BLOOM

投稿日: 2024年12月10日作成者: jarxiv

要約複数の言語を使用して大規模な言語モデルを命令チューニングすることで、多言語 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

JAPAGEN: Efficient Few/Zero-shot Learning via Japanese Training Dataset Generation with LLM

投稿日: 2024年12月10日作成者: jarxiv

要約最近のいくつかの研究では、教師ありトレーニングデータの効果的なジェネレー … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

The broader spectrum of in-context learning

投稿日: 2024年12月10日作成者: jarxiv

要約文脈内のいくつかの例からタスクを学習する言語モデルの機能は、大きな関心を集 … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Refusal Tokens: A Simple Way to Calibrate Refusals in Large Language Models

投稿日: 2024年12月10日作成者: jarxiv

要約安全で信頼性の高い言語モデルを構築するための重要な要素は、モデルが特定の指 … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Training Large Language Models to Reason in a Continuous Latent Space

投稿日: 2024年12月10日作成者: jarxiv

要約大規模言語モデル (LLM) は、「言語空間」での推論に限定されており、通 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

ProcessBench: Identifying Process Errors in Mathematical Reasoning

投稿日: 2024年12月10日作成者: jarxiv

要約言語モデルは数学の問題を解くときに定期的に間違いを犯すため、推論プロセスに … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Improving the Efficiency of Visually Augmented Language Models

投稿日: 2024年12月10日作成者: jarxiv

要約自己回帰言語モデル (LM) の優れたパフォーマンスにもかかわらず、報告バ … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

CIC: A Framework for Culturally-Aware Image Captioning

投稿日: 2024年12月10日作成者: jarxiv

要約画像キャプションは、BLIP などの視覚言語事前学習モデル (VLP) を … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

I Don’t Know: Explicit Modeling of Uncertainty with an [IDK] Token

AutoDCWorkflow: LLM-based Data Cleaning Workflow Auto-Generation and Benchmark

How Many Languages Make Good Multilingual Instruction Tuning? A Case Study on BLOOM

JAPAGEN: Efficient Few/Zero-shot Learning via Japanese Training Dataset Generation with LLM

The broader spectrum of in-context learning

Refusal Tokens: A Simple Way to Calibrate Refusals in Large Language Models

Training Large Language Models to Reason in a Continuous Latent Space

ProcessBench: Identifying Process Errors in Mathematical Reasoning

Improving the Efficiency of Visually Augmented Language Models

CIC: A Framework for Culturally-Aware Image Captioning

最近の投稿

最近のコメント

アーカイブ

カテゴリー