「cs.CL」カテゴリーアーカイブ

Recent Trends in Linear Text Segmentation: a Survey

投稿日: 2024年11月26日作成者: jarxiv

要約線形テキストセグメンテーションは、テキストドキュメントにトピックの変化 … 続きを読む →

カテゴリー: cs.CL, I.2.7 | コメントを受け付けていません

StructFormer: Document Structure-based Masked Attention and its Impact on Language Model Pre-Training

投稿日: 2024年11月26日作成者: jarxiv

要約現在、言語モデル (LM) の最先端技術のほとんどは、トランスフォーマー … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Marco-o1: Towards Open Reasoning Models for Open-Ended Solutions

投稿日: 2024年11月26日作成者: jarxiv

要約現在、OpenAI o1 は、大規模推論モデル (LRM) の研究への関心 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Preventing Jailbreak Prompts as Malicious Tools for Cybercriminals: A Cyber Defense Perspective

投稿日: 2024年11月26日作成者: jarxiv

要約脱獄プロンプトは、大規模な言語モデルの倫理的保護手段を回避するように作られ … 続きを読む →

カテゴリー: cs.CL, cs.CR | コメントを受け付けていません

Do Large Language Models Perform Latent Multi-Hop Reasoning without Exploiting Shortcuts?

投稿日: 2024年11月26日作成者: jarxiv

要約「スカーレット・ヨハンソンが生まれた年に、夏季オリンピックはの国で開催さ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Human-Calibrated Automated Testing and Validation of Generative Language Models

投稿日: 2024年11月26日作成者: jarxiv

要約このペーパーでは、銀行などのリスクの高い分野に導入された検索拡張生成 (R … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Adapter-based Approaches to Knowledge-enhanced Language Models — A Survey

投稿日: 2024年11月26日作成者: jarxiv

要約知識強化言語モデル (KELM) は、大規模な言語モデルとドメイン固有の知 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

When Babies Teach Babies: Can student knowledge sharing outperform Teacher-Guided Distillation on small datasets?

投稿日: 2024年11月26日作成者: jarxiv

要約データ効率の高い言語モデルの事前トレーニングの限界を押し上げることを目的と … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

O1 Replication Journey — Part 2: Surpassing O1-preview through Simple Distillation, Big Progress or Bitter Lesson?

投稿日: 2024年11月26日作成者: jarxiv

要約このペーパーでは、OpenAI の O1 モデル機能を複製するための現在の … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Fundamental Limits of Prompt Tuning Transformers: Universality, Capacity and Efficiency

投稿日: 2024年11月26日作成者: jarxiv

要約変圧器ベースの基礎モデルの即時調整の統計的および計算上の限界を調査します。 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, stat.ML | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

Recent Trends in Linear Text Segmentation: a Survey

StructFormer: Document Structure-based Masked Attention and its Impact on Language Model Pre-Training

Marco-o1: Towards Open Reasoning Models for Open-Ended Solutions

Preventing Jailbreak Prompts as Malicious Tools for Cybercriminals: A Cyber Defense Perspective

Do Large Language Models Perform Latent Multi-Hop Reasoning without Exploiting Shortcuts?

Human-Calibrated Automated Testing and Validation of Generative Language Models

Adapter-based Approaches to Knowledge-enhanced Language Models — A Survey

When Babies Teach Babies: Can student knowledge sharing outperform Teacher-Guided Distillation on small datasets?

O1 Replication Journey — Part 2: Surpassing O1-preview through Simple Distillation, Big Progress or Bitter Lesson?

Fundamental Limits of Prompt Tuning Transformers: Universality, Capacity and Efficiency

最近の投稿

最近のコメント

アーカイブ

カテゴリー