cs.AI」カテゴリーアーカイブ

LLMs on the Line: Data Determines Loss-to-Loss Scaling Laws

要約 スケーリング法は、モデルサイズ、トークン、および計算の最適なバランスの推定 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | LLMs on the Line: Data Determines Loss-to-Loss Scaling Laws はコメントを受け付けていません

Joint-GCG: Unified Gradient-Based Poisoning Attacks on Retrieval-Augmented Generation Systems

要約 回答を生成する前に外部コーパスから関連するドキュメントを取得することにより … 続きを読む

カテゴリー: cs.AI, cs.CR | Joint-GCG: Unified Gradient-Based Poisoning Attacks on Retrieval-Augmented Generation Systems はコメントを受け付けていません

Deconfounding Multi-Cause Latent Confounders: A Factor-Model Approach to Climate Model Bias Correction

要約 グローバルな気候モデル(GCM)は、地球システムをシミュレートすることによ … 続きを読む

カテゴリー: cs.AI, cs.LG, physics.ao-ph, stat.ML | Deconfounding Multi-Cause Latent Confounders: A Factor-Model Approach to Climate Model Bias Correction はコメントを受け付けていません

Not All Rollouts are Useful: Down-Sampling Rollouts in LLM Reinforcement Learning

要約 検証可能な報酬(RLVR)による強化学習は、大規模な言語モデルの推論能力を … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Not All Rollouts are Useful: Down-Sampling Rollouts in LLM Reinforcement Learning はコメントを受け付けていません

Recommender systems, stigmergy, and the tyranny of popularity

要約 Google ScholarやWeb of Scienceなどの科学的推奨 … 続きを読む

カテゴリー: cs.AI, cs.CY, cs.HC, cs.IR | Recommender systems, stigmergy, and the tyranny of popularity はコメントを受け付けていません

(AI peers) are people learning from the same standpoint: Perception of AI characters in a Collaborative Science Investigation

要約 21世紀の要求の複雑さは、複雑な能力を促進するための教育的アプローチを促進 … 続きを読む

カテゴリー: cs.AI, cs.HC | (AI peers) are people learning from the same standpoint: Perception of AI characters in a Collaborative Science Investigation はコメントを受け付けていません

The Lock-in Hypothesis: Stagnation by Algorithm

要約 大規模な言語モデル(LLMS)のトレーニングと展開は、人間のユーザーとのフ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CY, cs.HC, cs.LG | The Lock-in Hypothesis: Stagnation by Algorithm はコメントを受け付けていません

semantic-features: A User-Friendly Tool for Studying Contextual Word Embeddings in Interpretable Semantic Spaces

要約 Chronis et al。 (2023)LMSの文脈化された単語の埋め込 … 続きを読む

カテゴリー: cs.AI, cs.CL | semantic-features: A User-Friendly Tool for Studying Contextual Word Embeddings in Interpretable Semantic Spaces はコメントを受け付けていません

A Riemannian Optimization Perspective of the Gauss-Newton Method for Feedforward Neural Networks

要約 スムーズな活性化関数でニューラルネットワークをトレーニングするためのGau … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.SY, eess.SY, math.OC, stat.ML | A Riemannian Optimization Perspective of the Gauss-Newton Method for Feedforward Neural Networks はコメントを受け付けていません

DyGMamba: Efficiently Modeling Long-Term Temporal Dependency on Continuous-Time Dynamic Graphs with State Space Models

要約 連続時間動的グラフ(CTDG)の有用な表現を学習することは、長いノードの相 … 続きを読む

カテゴリー: cs.AI, cs.LG | DyGMamba: Efficiently Modeling Long-Term Temporal Dependency on Continuous-Time Dynamic Graphs with State Space Models はコメントを受け付けていません