cs.AI」カテゴリーアーカイブ

Crafting Knowledge: Exploring the Creative Mechanisms of Chat-Based Search Engines

要約 デジタル情報の普及の分野では、検索エンジンは情報探索者とプロバイダーをつな … 続きを読む

カテゴリー: cs.AI, cs.IR, econ.GN, J.4, q-fin.EC | Crafting Knowledge: Exploring the Creative Mechanisms of Chat-Based Search Engines はコメントを受け付けていません

Compositional API Recommendation for Library-Oriented Code Generation

要約 大規模言語モデル (LLM) は、コード生成において優れたパフォーマンスを … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SE | Compositional API Recommendation for Library-Oriented Code Generation はコメントを受け付けていません

Towards Green AI in Fine-tuning Large Language Models via Adaptive Backpropagation

要約 微調整は、事前トレーニングされた大規模言語モデル (LLM) をダウンスト … 続きを読む

カテゴリー: cs.AI, cs.LG | Towards Green AI in Fine-tuning Large Language Models via Adaptive Backpropagation はコメントを受け付けていません

Differentially Private Worst-group Risk Minimization

要約 $(\epsilon, \delta)$-差分プライバシー (DP) の下 … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.LG | Differentially Private Worst-group Risk Minimization はコメントを受け付けていません

Training Dynamics of Multi-Head Softmax Attention for In-Context Learning: Emergence, Convergence, and Optimality

要約 マルチタスク線形回帰のインコンテキスト学習のためのマルチヘッド ソフトマッ … 続きを読む

カテゴリー: cs.AI, cs.LG, math.OC, math.ST, stat.ML, stat.TH | Training Dynamics of Multi-Head Softmax Attention for In-Context Learning: Emergence, Convergence, and Optimality はコメントを受け付けていません

Probing the Information Encoded in Neural-based Acoustic Models of Automatic Speech Recognition Systems

要約 深層学習アーキテクチャは、多くの研究分野でパフォーマンスの面で大幅な進歩を … 続きを読む

カテゴリー: cs.AI, cs.SD, eess.AS | Probing the Information Encoded in Neural-based Acoustic Models of Automatic Speech Recognition Systems はコメントを受け付けていません

ArCHer: Training Language Model Agents via Hierarchical Multi-Turn RL

要約 大規模言語モデル (LLM) の幅広い使用例は、目標指向の意思決定タスク … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | ArCHer: Training Language Model Agents via Hierarchical Multi-Turn RL はコメントを受け付けていません

Revisiting the Hypothesis: Do pretrained Transformers Learn In-Context by Gradient Descent?

要約 LLM における In-Context Learning (ICL) の出 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Revisiting the Hypothesis: Do pretrained Transformers Learn In-Context by Gradient Descent? はコメントを受け付けていません

Functional Benchmarks for Robust Evaluation of Reasoning Performance, and the Reasoning Gap

要約 ベンチマークの関数バリアントを使用して、言語モデルの推論能力を堅牢に評価す … 続きを読む

カテゴリー: cs.AI, cs.CL | Functional Benchmarks for Robust Evaluation of Reasoning Performance, and the Reasoning Gap はコメントを受け付けていません

$\texttt{COSMIC}$: Mutual Information for Task-Agnostic Summarization Evaluation

要約 サマライザの品質を評価することは、大きな課題を引き起こします。 これに応え … 続きを読む

カテゴリー: cs.AI, cs.CL | $\texttt{COSMIC}$: Mutual Information for Task-Agnostic Summarization Evaluation はコメントを受け付けていません