cs.CL」カテゴリーアーカイブ

BitNet a4.8: 4-bit Activations for 1-bit LLMs

要約 BitNet b1.58 などの 1 ビット大規模言語モデル (LLM) … 続きを読む

カテゴリー: cs.CL, cs.LG | BitNet a4.8: 4-bit Activations for 1-bit LLMs はコメントを受け付けていません

The Semantic Hub Hypothesis: Language Models Share Semantic Representations Across Languages and Modalities

要約 最新の言語モデルは、さまざまな言語やモダリティにわたる入力を処理できます。 … 続きを読む

カテゴリー: cs.CL | The Semantic Hub Hypothesis: Language Models Share Semantic Representations Across Languages and Modalities はコメントを受け付けていません

Mixture-of-Transformers: A Sparse and Scalable Architecture for Multi-Modal Foundation Models

要約 大規模言語モデル (LLM) の開発は、統一されたフレームワーク内でテキス … 続きを読む

カテゴリー: cs.CL | Mixture-of-Transformers: A Sparse and Scalable Architecture for Multi-Modal Foundation Models はコメントを受け付けていません

Needle Threading: Can LLMs Follow Threads through Near-Million-Scale Haystacks?

要約 大規模言語モデル (LLM) のコンテキスト制限が増加するにつれて、可能な … 続きを読む

カテゴリー: cs.CL | Needle Threading: Can LLMs Follow Threads through Near-Million-Scale Haystacks? はコメントを受け付けていません

Enhancing Investment Analysis: Optimizing AI-Agent Collaboration in Financial Research

要約 近年、財務分析や投資意思決定における生成人工知能 (GenAI) の応用が … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, q-fin.ST, q-fin.TR | Enhancing Investment Analysis: Optimizing AI-Agent Collaboration in Financial Research はコメントを受け付けていません

AlignXIE: Improving Multilingual Information Extraction by Cross-Lingual Alignment

要約 経験的証拠は、LLM が自発的に異言語間アライメントを示すことを示唆してい … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | AlignXIE: Improving Multilingual Information Extraction by Cross-Lingual Alignment はコメントを受け付けていません

Kwai-STaR: Transform LLMs into State-Transition Reasoners

要約 数学的推論は、LLM の認知能力に重大な課題をもたらします。 LLM の数 … 続きを読む

カテゴリー: cs.AI, cs.CL | Kwai-STaR: Transform LLMs into State-Transition Reasoners はコメントを受け付けていません

Gradient Cuff: Detecting Jailbreak Attacks on Large Language Models by Exploring Refusal Loss Landscapes

要約 Large Language Model (LLM) は、ユーザーがクエリ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG | Gradient Cuff: Detecting Jailbreak Attacks on Large Language Models by Exploring Refusal Loss Landscapes はコメントを受け付けていません

FRACTURED-SORRY-Bench: Framework for Revealing Attacks in Conversational Turns Undermining Refusal Efficacy and Defenses over SORRY-Bench (Automated Multi-shot Jailbreaks)

要約 このペーパーでは、マルチターン会話攻撃に対する大規模言語モデル (LLM) … 続きを読む

カテゴリー: cs.AI, cs.CL | FRACTURED-SORRY-Bench: Framework for Revealing Attacks in Conversational Turns Undermining Refusal Efficacy and Defenses over SORRY-Bench (Automated Multi-shot Jailbreaks) はコメントを受け付けていません

Personalized Large Language Models

要約 大規模言語モデル (LLM) は、近年、自然言語処理 (NLP) タスクを … 続きを読む

カテゴリー: cs.AI, cs.CL | Personalized Large Language Models はコメントを受け付けていません