「cs.CL」カテゴリーアーカイブ

Learning from ‘Silly’ Questions Improves Large Language Models, But Only Slightly

投稿日: 2024年11月22日作成者: jarxiv

要約高品質の教師あり微調整 (SFT) データセットの構築は、大規模言語モデル … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Visual Contexts Clarify Ambiguous Expressions: A Benchmark Dataset

投稿日: 2024年11月22日作成者: jarxiv

要約現実世界のシナリオでモデルが人間と効果的に対話するには、マルチモーダルな入 … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

What Languages are Easy to Language-Model? A Perspective from Learning Probabilistic Regular Languages

投稿日: 2024年11月22日作成者: jarxiv

要約大規模な言語モデルは何を学習できるのでしょうか? 定義上、言語モデル (L … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Why do language models perform worse for morphologically complex languages?

投稿日: 2024年11月22日作成者: jarxiv

要約言語モデルのパフォーマンスは言語ごとに異なります。形態学的類型学がこの変 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Efficient Aspect-Based Summarization of Climate Change Reports with Small Language Models

投稿日: 2024年11月22日作成者: jarxiv

要約気候変動対策の意思決定者を支援するための自然言語処理 (NLP) の使用は … 続きを読む →

カテゴリー: cs.CL, I.2.7 | コメントを受け付けていません

Velocitune: A Velocity-based Dynamic Domain Reweighting Method for Continual Pre-training

投稿日: 2024年11月22日作成者: jarxiv

要約大規模な言語モデルをトレーニングするには、多様なコーパスが重要であることは … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

POS-tagging to highlight the skeletal structure of sentences

投稿日: 2024年11月22日作成者: jarxiv

要約この研究では、トークン分類のための BERT アーキテクチャによる転移学習 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Lightweight Safety Guardrails Using Fine-tuned BERT Embeddings

投稿日: 2024年11月22日作成者: jarxiv

要約最近の大規模言語モデル (LLM) の急増により、企業は概念実証やプロトタ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Marco-o1: Towards Open Reasoning Models for Open-Ended Solutions

投稿日: 2024年11月22日作成者: jarxiv

要約現在、OpenAI o1 は、大規模推論モデル (LRM) の研究への関心 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

OpenScholar: Synthesizing Scientific Literature with Retrieval-augmented LMs

投稿日: 2024年11月22日作成者: jarxiv

要約科学の進歩は、増え続ける文献を総合する研究者の能力にかかっています。大規 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.IR, cs.LG | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

Learning from ‘Silly’ Questions Improves Large Language Models, But Only Slightly

Visual Contexts Clarify Ambiguous Expressions: A Benchmark Dataset

What Languages are Easy to Language-Model? A Perspective from Learning Probabilistic Regular Languages

Why do language models perform worse for morphologically complex languages?

Efficient Aspect-Based Summarization of Climate Change Reports with Small Language Models

Velocitune: A Velocity-based Dynamic Domain Reweighting Method for Continual Pre-training

POS-tagging to highlight the skeletal structure of sentences

Lightweight Safety Guardrails Using Fine-tuned BERT Embeddings

Marco-o1: Towards Open Reasoning Models for Open-Ended Solutions

OpenScholar: Synthesizing Scientific Literature with Retrieval-augmented LMs

最近の投稿

最近のコメント

アーカイブ

カテゴリー