cs.CL」カテゴリーアーカイブ

Recent Trends in Linear Text Segmentation: a Survey

要約 線形テキスト セグメンテーションは、テキスト ドキュメントにトピックの変化 … 続きを読む

カテゴリー: cs.CL, I.2.7 | Recent Trends in Linear Text Segmentation: a Survey はコメントを受け付けていません

StructFormer: Document Structure-based Masked Attention and its Impact on Language Model Pre-Training

要約 現在、言語モデル (LM) の最先端技術のほとんどは、トランスフォーマー … 続きを読む

カテゴリー: cs.CL | StructFormer: Document Structure-based Masked Attention and its Impact on Language Model Pre-Training はコメントを受け付けていません

Marco-o1: Towards Open Reasoning Models for Open-Ended Solutions

要約 現在、OpenAI o1 は、大規模推論モデル (LRM) の研究への関心 … 続きを読む

カテゴリー: cs.CL | Marco-o1: Towards Open Reasoning Models for Open-Ended Solutions はコメントを受け付けていません

Preventing Jailbreak Prompts as Malicious Tools for Cybercriminals: A Cyber Defense Perspective

要約 脱獄プロンプトは、大規模な言語モデルの倫理的保護手段を回避するように作られ … 続きを読む

カテゴリー: cs.CL, cs.CR | Preventing Jailbreak Prompts as Malicious Tools for Cybercriminals: A Cyber Defense Perspective はコメントを受け付けていません

Do Large Language Models Perform Latent Multi-Hop Reasoning without Exploiting Shortcuts?

要約 「スカーレット・ヨハンソンが生まれた年に、夏季オリンピックは の国で開催さ … 続きを読む

カテゴリー: cs.CL | Do Large Language Models Perform Latent Multi-Hop Reasoning without Exploiting Shortcuts? はコメントを受け付けていません

Human-Calibrated Automated Testing and Validation of Generative Language Models

要約 このペーパーでは、銀行などのリスクの高い分野に導入された検索拡張生成 (R … 続きを読む

カテゴリー: cs.AI, cs.CL | Human-Calibrated Automated Testing and Validation of Generative Language Models はコメントを受け付けていません

Adapter-based Approaches to Knowledge-enhanced Language Models — A Survey

要約 知識強化言語モデル (KELM) は、大規模な言語モデルとドメイン固有の知 … 続きを読む

カテゴリー: cs.AI, cs.CL | Adapter-based Approaches to Knowledge-enhanced Language Models — A Survey はコメントを受け付けていません

When Babies Teach Babies: Can student knowledge sharing outperform Teacher-Guided Distillation on small datasets?

要約 データ効率の高い言語モデルの事前トレーニングの限界を押し上げることを目的と … 続きを読む

カテゴリー: cs.AI, cs.CL | When Babies Teach Babies: Can student knowledge sharing outperform Teacher-Guided Distillation on small datasets? はコメントを受け付けていません

O1 Replication Journey — Part 2: Surpassing O1-preview through Simple Distillation, Big Progress or Bitter Lesson?

要約 このペーパーでは、OpenAI の O1 モデル機能を複製するための現在の … 続きを読む

カテゴリー: cs.AI, cs.CL | O1 Replication Journey — Part 2: Surpassing O1-preview through Simple Distillation, Big Progress or Bitter Lesson? はコメントを受け付けていません

Fundamental Limits of Prompt Tuning Transformers: Universality, Capacity and Efficiency

要約 変圧器ベースの基礎モデルの即時調整の統計的および計算上の限界を調査します。 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, stat.ML | Fundamental Limits of Prompt Tuning Transformers: Universality, Capacity and Efficiency はコメントを受け付けていません