「cs.CL」カテゴリーアーカイブ

BitNet a4.8: 4-bit Activations for 1-bit LLMs

投稿日: 2024年11月8日作成者: jarxiv

要約 BitNet b1.58 などの 1 ビット大規模言語モデル (LLM) … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

The Semantic Hub Hypothesis: Language Models Share Semantic Representations Across Languages and Modalities

投稿日: 2024年11月8日作成者: jarxiv

要約最新の言語モデルは、さまざまな言語やモダリティにわたる入力を処理できます。 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Mixture-of-Transformers: A Sparse and Scalable Architecture for Multi-Modal Foundation Models

投稿日: 2024年11月8日作成者: jarxiv

要約大規模言語モデル (LLM) の開発は、統一されたフレームワーク内でテキス … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Needle Threading: Can LLMs Follow Threads through Near-Million-Scale Haystacks?

投稿日: 2024年11月8日作成者: jarxiv

要約大規模言語モデル (LLM) のコンテキスト制限が増加するにつれて、可能な … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Enhancing Investment Analysis: Optimizing AI-Agent Collaboration in Financial Research

投稿日: 2024年11月8日作成者: jarxiv

要約近年、財務分析や投資意思決定における生成人工知能 (GenAI) の応用が … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, q-fin.ST, q-fin.TR | コメントを受け付けていません

AlignXIE: Improving Multilingual Information Extraction by Cross-Lingual Alignment

投稿日: 2024年11月8日作成者: jarxiv

要約経験的証拠は、LLM が自発的に異言語間アライメントを示すことを示唆してい … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Kwai-STaR: Transform LLMs into State-Transition Reasoners

投稿日: 2024年11月8日作成者: jarxiv

要約数学的推論は、LLM の認知能力に重大な課題をもたらします。 LLM の数 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Gradient Cuff: Detecting Jailbreak Attacks on Large Language Models by Exploring Refusal Loss Landscapes

投稿日: 2024年11月8日作成者: jarxiv

要約 Large Language Model (LLM) は、ユーザーがクエリ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG | コメントを受け付けていません

FRACTURED-SORRY-Bench: Framework for Revealing Attacks in Conversational Turns Undermining Refusal Efficacy and Defenses over SORRY-Bench (Automated Multi-shot Jailbreaks)

投稿日: 2024年11月8日作成者: jarxiv

要約このペーパーでは、マルチターン会話攻撃に対する大規模言語モデル (LLM) … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Personalized Large Language Models

投稿日: 2024年11月8日作成者: jarxiv

要約大規模言語モデル (LLM) は、近年、自然言語処理 (NLP) タスクを … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

BitNet a4.8: 4-bit Activations for 1-bit LLMs

The Semantic Hub Hypothesis: Language Models Share Semantic Representations Across Languages and Modalities

Mixture-of-Transformers: A Sparse and Scalable Architecture for Multi-Modal Foundation Models

Needle Threading: Can LLMs Follow Threads through Near-Million-Scale Haystacks?

Enhancing Investment Analysis: Optimizing AI-Agent Collaboration in Financial Research

AlignXIE: Improving Multilingual Information Extraction by Cross-Lingual Alignment

Kwai-STaR: Transform LLMs into State-Transition Reasoners

Gradient Cuff: Detecting Jailbreak Attacks on Large Language Models by Exploring Refusal Loss Landscapes

FRACTURED-SORRY-Bench: Framework for Revealing Attacks in Conversational Turns Undermining Refusal Efficacy and Defenses over SORRY-Bench (Automated Multi-shot Jailbreaks)

Personalized Large Language Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー