月別アーカイブ: 2024年5月

Understanding and Minimising Outlier Features in Neural Network Training

要約 外れ値特徴 (OF) は、その活性化の大きさがニューラル ネットワーク ( … 続きを読む

カテゴリー: cs.LG | Understanding and Minimising Outlier Features in Neural Network Training はコメントを受け付けていません

Causal Inference from Slowly Varying Nonstationary Processes

要約 制限構造因果モデル (SCM) フレームワークに従った観察データからの因果 … 続きを読む

カテゴリー: cs.LG, stat.ML | Causal Inference from Slowly Varying Nonstationary Processes はコメントを受け付けていません

DiveR-CT: Diversity-enhanced Red Teaming with Relaxing Constraints

要約 大規模言語モデル (LLM) の最近の進歩により、LLM は不可欠なものと … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG | DiveR-CT: Diversity-enhanced Red Teaming with Relaxing Constraints はコメントを受け付けていません

From One to Many: Expanding the Scope of Toxicity Mitigation in Language Models

要約 これまで、言語モデルにおける有害性の軽減は、ほぼ完全に単一言語設定に焦点を … 続きを読む

カテゴリー: cs.AI, cs.CL | From One to Many: Expanding the Scope of Toxicity Mitigation in Language Models はコメントを受け付けていません

Open-Source LLMs for Text Annotation: A Practical Guide for Model Setting and Fine-Tuning

要約 この論文では、政治科学研究に典型的なテキスト分類タスクにおけるオープンソー … 続きを読む

カテゴリー: cs.CL | Open-Source LLMs for Text Annotation: A Practical Guide for Model Setting and Fine-Tuning はコメントを受け付けていません

BLSP-KD: Bootstrapping Language-Speech Pre-training via Knowledge Distillation

要約 最近のエンドツーエンドのアプローチは、大規模言語モデル (LLM) を音声 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | BLSP-KD: Bootstrapping Language-Speech Pre-training via Knowledge Distillation はコメントを受け付けていません

Building Guardrails for Large Language Models

要約 大規模言語モデル (LLM) が私たちの日常生活にさらに統合されるにつれて … 続きを読む

カテゴリー: cs.AI, cs.CL | Building Guardrails for Large Language Models はコメントを受け付けていません

Confidence Under the Hood: An Investigation into the Confidence-Probability Alignment in Large Language Models

要約 大規模言語モデル (LLM) の使用がさらに普及するにつれて、生成された応 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Confidence Under the Hood: An Investigation into the Confidence-Probability Alignment in Large Language Models はコメントを受け付けていません

Cephalo: Multi-Modal Vision-Language Models for Bio-Inspired Materials Analysis and Design

要約 Cephalo は、材料科学アプリケーション向けに設計された一連のマルチモ … 続きを読む

カテゴリー: cond-mat.mes-hall, cond-mat.mtrl-sci, cs.CL, cs.CV, cs.LG | Cephalo: Multi-Modal Vision-Language Models for Bio-Inspired Materials Analysis and Design はコメントを受け付けていません

Beyond the Limits: A Survey of Techniques to Extend the Context Length in Large Language Models

要約 最近、大規模言語モデル (LLM) は、コンテキストの理解、論理的推論の実 … 続きを読む

カテゴリー: cs.CL, cs.LG | Beyond the Limits: A Survey of Techniques to Extend the Context Length in Large Language Models はコメントを受け付けていません