月別アーカイブ: 2024年7月

Weighted Grouped Query Attention in Transformers

要約 アテンション メカニズムは、トランスフォーマー言語モデルの基本ブロックを形 … 続きを読む

カテゴリー: cs.AI, cs.CL | Weighted Grouped Query Attention in Transformers はコメントを受け付けていません

Connecting the Dots: Evaluating Abstract Reasoning Capabilities of LLMs Using the New York Times Connections Word Game

要約 New York Times Connections ゲームは、ワード パ … 続きを読む

カテゴリー: cs.AI, cs.CL | Connecting the Dots: Evaluating Abstract Reasoning Capabilities of LLMs Using the New York Times Connections Word Game はコメントを受け付けていません

Understanding the Importance of Evolutionary Search in Automated Heuristic Design with Large Language Models

要約 自動ヒューリスティック設計 (AHD) は、効果的なヒューリスティックの開 … 続きを読む

カテゴリー: cs.AI, cs.NE | Understanding the Importance of Evolutionary Search in Automated Heuristic Design with Large Language Models はコメントを受け付けていません

Deep Causal Learning to Explain and Quantify The Geo-Tension’s Impact on Natural Gas Market

要約 天然ガス需要は天然ガス価格を予測するための重要な要素であるため、電力システ … 続きを読む

カテゴリー: cs.AI, cs.LG | Deep Causal Learning to Explain and Quantify The Geo-Tension’s Impact on Natural Gas Market はコメントを受け付けていません

Hey, That’s My Model! Introducing Chain & Hash, An LLM Fingerprinting Technique

要約 大規模言語モデル (LLM) の盗難や悪用の容易さに対する懸念が高まる中、 … 続きを読む

カテゴリー: cs.AI, cs.CR | Hey, That’s My Model! Introducing Chain & Hash, An LLM Fingerprinting Technique はコメントを受け付けていません

Leveraging LLM-Respondents for Item Evaluation: a Psychometric Analysis

要約 効果的な教育測定は、適切に設計されたアイテムプールのキュレーション (つま … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CY | Leveraging LLM-Respondents for Item Evaluation: a Psychometric Analysis はコメントを受け付けていません

Dissecting Deep RL with High Update Ratios: Combatting Value Divergence

要約 深層強化学習アルゴリズムは、値関数の発散に対処することで、勾配更新の数が環 … 続きを読む

カテゴリー: cs.AI, cs.LG | Dissecting Deep RL with High Update Ratios: Combatting Value Divergence はコメントを受け付けていません

Fine-Tuning and Prompt Optimization: Two Great Steps that Work Better Together

要約 自然言語処理 (NLP) システムは、複数の個別言語モデル (LM) とプ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Fine-Tuning and Prompt Optimization: Two Great Steps that Work Better Together はコメントを受け付けていません

Spider2-V: How Far Are Multimodal Agents From Automating Data Science and Engineering Workflows?

要約 データ サイエンスとエンジニアリングのワークフローは、多くの場合、BigQ … 続きを読む

カテゴリー: cs.AI, cs.CL | Spider2-V: How Far Are Multimodal Agents From Automating Data Science and Engineering Workflows? はコメントを受け付けていません

Make-An-Agent: A Generalizable Policy Network Generator with Behavior-Prompted Diffusion

要約 テキストによる説明から画像を作成するのと同じくらい簡単に、望ましい動作の … 続きを読む

カテゴリー: cs.AI | Make-An-Agent: A Generalizable Policy Network Generator with Behavior-Prompted Diffusion はコメントを受け付けていません