cs.CL」カテゴリーアーカイブ

Choosy Babies Need One Coach: Inducing Mode-Seeking Behavior in BabyLlama with Reverse KL Divergence

要約 この研究は、第 2 回 BabyLM チャレンジの Strict-Smal … 続きを読む

カテゴリー: cs.CL | Choosy Babies Need One Coach: Inducing Mode-Seeking Behavior in BabyLlama with Reverse KL Divergence はコメントを受け付けていません

Unlearning as multi-task optimization: A normalized gradient difference approach with an adaptive learning rate

要約 機械の非学習は、大規模言語モデル (LLM) によって取得された不要な知識 … 続きを読む

カテゴリー: cs.CL, cs.LG | Unlearning as multi-task optimization: A normalized gradient difference approach with an adaptive learning rate はコメントを受け付けていません

Joint Extraction and Classification of Danish Competences for Job Matching

要約 スキル、職業、知識などの能力のマッチングは、候補者が仕事に適しているかどう … 続きを読む

カテゴリー: cs.CL, cs.LG | Joint Extraction and Classification of Danish Competences for Job Matching はコメントを受け付けていません

Proximal Causal Inference With Text Data

要約 最近のテキストベースの因果関係手法は、非構造化テキスト データから部分的ま … 続きを読む

カテゴリー: cs.CL, cs.LG, stat.ME | Proximal Causal Inference With Text Data はコメントを受け付けていません

AmpleGCG-Plus: A Strong Generative Model of Adversarial Suffixes to Jailbreak LLMs with Higher Success Rates in Fewer Attempts

要約 大規模言語モデル (LLM) は通常は調整されていますが、自然言語で慎重に … 続きを読む

カテゴリー: cs.CL | AmpleGCG-Plus: A Strong Generative Model of Adversarial Suffixes to Jailbreak LLMs with Higher Success Rates in Fewer Attempts はコメントを受け付けていません

Benchmarking LLM Guardrails in Handling Multilingual Toxicity

要約 大規模言語モデル (LLM) の普及により、有害なコンテンツを検出して防御 … 続きを読む

カテゴリー: cs.CL | Benchmarking LLM Guardrails in Handling Multilingual Toxicity はコメントを受け付けていません

Very Attentive Tacotron: Robust and Unbounded Length Generalization in Autoregressive Transformer-Based Text-to-Speech

要約 自己回帰 (AR) Transformer ベースのシーケンス モデルは、 … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | Very Attentive Tacotron: Robust and Unbounded Length Generalization in Autoregressive Transformer-Based Text-to-Speech はコメントを受け付けていません

Class-Aware Contrastive Optimization for Imbalanced Text Classification

要約 テキスト データの固有の特性により、分類タスクは複雑な問題になります。 教 … 続きを読む

カテゴリー: cs.CL | Class-Aware Contrastive Optimization for Imbalanced Text Classification はコメントを受け付けていません

Towards a theory of how the structure of language is acquired by deep neural networks

要約 ネクストトークン予測によって言語の構造を学習するにはどれくらいのデータが必 … 続きを読む

カテゴリー: cond-mat.dis-nn, cs.CL, cs.LG | Towards a theory of how the structure of language is acquired by deep neural networks はコメントを受け付けていません

ProMQA: Question Answering Dataset for Multimodal Procedural Activity Understanding

要約 マルチモーダル システムは、人間が目標を達成するために指示に従うという手順 … 続きを読む

カテゴリー: cs.CL | ProMQA: Question Answering Dataset for Multimodal Procedural Activity Understanding はコメントを受け付けていません