cs.CL」カテゴリーアーカイブ

Learning from ‘Silly’ Questions Improves Large Language Models, But Only Slightly

要約 高品質の教師あり微調整 (SFT) データセットの構築は、大規模言語モデル … 続きを読む

カテゴリー: cs.CL | Learning from ‘Silly’ Questions Improves Large Language Models, But Only Slightly はコメントを受け付けていません

Visual Contexts Clarify Ambiguous Expressions: A Benchmark Dataset

要約 現実世界のシナリオでモデルが人間と効果的に対話するには、マルチモーダルな入 … 続きを読む

カテゴリー: cs.CL, cs.CV | Visual Contexts Clarify Ambiguous Expressions: A Benchmark Dataset はコメントを受け付けていません

What Languages are Easy to Language-Model? A Perspective from Learning Probabilistic Regular Languages

要約 大規模な言語モデルは何を学習できるのでしょうか? 定義上、言語モデル (L … 続きを読む

カテゴリー: cs.CL | What Languages are Easy to Language-Model? A Perspective from Learning Probabilistic Regular Languages はコメントを受け付けていません

Why do language models perform worse for morphologically complex languages?

要約 言語モデルのパフォーマンスは言語ごとに異なります。 形態学的類型学がこの変 … 続きを読む

カテゴリー: cs.CL | Why do language models perform worse for morphologically complex languages? はコメントを受け付けていません

Efficient Aspect-Based Summarization of Climate Change Reports with Small Language Models

要約 気候変動対策の意思決定者を支援するための自然言語処理 (NLP) の使用は … 続きを読む

カテゴリー: cs.CL, I.2.7 | Efficient Aspect-Based Summarization of Climate Change Reports with Small Language Models はコメントを受け付けていません

Velocitune: A Velocity-based Dynamic Domain Reweighting Method for Continual Pre-training

要約 大規模な言語モデルをトレーニングするには、多様なコーパスが重要であることは … 続きを読む

カテゴリー: cs.CL | Velocitune: A Velocity-based Dynamic Domain Reweighting Method for Continual Pre-training はコメントを受け付けていません

POS-tagging to highlight the skeletal structure of sentences

要約 この研究では、トークン分類のための BERT アーキテクチャによる転移学習 … 続きを読む

カテゴリー: cs.CL | POS-tagging to highlight the skeletal structure of sentences はコメントを受け付けていません

Lightweight Safety Guardrails Using Fine-tuned BERT Embeddings

要約 最近の大規模言語モデル (LLM) の急増により、企業は概念実証やプロトタ … 続きを読む

カテゴリー: cs.CL | Lightweight Safety Guardrails Using Fine-tuned BERT Embeddings はコメントを受け付けていません

Marco-o1: Towards Open Reasoning Models for Open-Ended Solutions

要約 現在、OpenAI o1 は、大規模推論モデル (LRM) の研究への関心 … 続きを読む

カテゴリー: cs.CL | Marco-o1: Towards Open Reasoning Models for Open-Ended Solutions はコメントを受け付けていません

OpenScholar: Synthesizing Scientific Literature with Retrieval-augmented LMs

要約 科学の進歩は、増え続ける文献を総合する研究者の能力にかかっています。 大規 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR, cs.LG | OpenScholar: Synthesizing Scientific Literature with Retrieval-augmented LMs はコメントを受け付けていません