cs.LG」カテゴリーアーカイブ

Generalization or Hallucination? Understanding Out-of-Context Reasoning in Transformers

要約 大規模な言語モデル(LLM)は微調整を通じて新しい知識を獲得できますが、こ … 続きを読む

カテゴリー: cs.CL, cs.LG | Generalization or Hallucination? Understanding Out-of-Context Reasoning in Transformers はコメントを受け付けていません

Decomposing MLP Activations into Interpretable Features via Semi-Nonnegative Matrix Factorization

要約 機械的解釈可能性の中心的な目標は、その出力を因果的に説明する大規模な言語モ … 続きを読む

カテゴリー: cs.CL, cs.LG | Decomposing MLP Activations into Interpretable Features via Semi-Nonnegative Matrix Factorization はコメントを受け付けていません

Improving LLM Safety Alignment with Dual-Objective Optimization

要約 大規模な言語モデル(LLM)の既存のトレーニング時間安全アライメント手法は … 続きを読む

カテゴリー: cs.CL, cs.CR, cs.LG | Improving LLM Safety Alignment with Dual-Objective Optimization はコメントを受け付けていません

Build the web for agents, not agents for the web

要約 大規模な言語モデル(LLMS)とマルチモーダルのカウンターパートの最近の進 … 続きを読む

カテゴリー: cs.CL, cs.LG | Build the web for agents, not agents for the web はコメントを受け付けていません

On the Geometry of Receiver Operating Characteristic and Precision-Recall Curves

要約 バイナリ分類問題における受信機動作特性(ROC)および精密リコール(PR) … 続きを読む

カテゴリー: cs.AI, cs.LG, math.ST, stat.ML, stat.TH | On the Geometry of Receiver Operating Characteristic and Precision-Recall Curves はコメントを受け付けていません

Efficiency Robustness of Dynamic Deep Learning Systems

要約 ディープラーニングシステム(DLSS)は、モバイルデバイスやIoTデバイス … 続きを読む

カテゴリー: cs.AI, cs.LG | Efficiency Robustness of Dynamic Deep Learning Systems はコメントを受け付けていません

Accelerating Diffusion Large Language Models with SlowFast: The Three Golden Principles

要約 拡散ベースの言語モデル(DLLM)は、並列トークンの生成を有効にし、推論潜 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Accelerating Diffusion Large Language Models with SlowFast: The Three Golden Principles はコメントを受け付けていません

Sample Complexity and Representation Ability of Test-time Scaling Paradigms

要約 テスト時間スケーリングパラダイムは、複雑なタスク上の大規模な言語モデル(L … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | Sample Complexity and Representation Ability of Test-time Scaling Paradigms はコメントを受け付けていません

Multi-group Uncertainty Quantification for Long-form Text Generation

要約 過去の作品は、不確実性の定量化を大規模な言語モデル(LLM)出力にどのよう … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Multi-group Uncertainty Quantification for Long-form Text Generation はコメントを受け付けていません

Data-Driven Prediction of Dynamic Interactions Between Robot Appendage and Granular Material

要約 特定の長さのスケールでの粒状地形とのロボット運動相互作用に関する基本的な洞 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.NA, cs.RO, math.NA | Data-Driven Prediction of Dynamic Interactions Between Robot Appendage and Granular Material はコメントを受け付けていません