cs.LG」カテゴリーアーカイブ

ZClip: Adaptive Spike Mitigation for LLM Pre-Training

要約 大規模言語モデル(LLM)の学習には、勾配の不安定性や損失スパイクなど、多 … 続きを読む

カテゴリー: cs.CL, cs.LG | ZClip: Adaptive Spike Mitigation for LLM Pre-Training はコメントを受け付けていません

Token-Driven GammaTune: Adaptive Calibration for Enhanced Speculative Decoding

要約 投機的復号は、より小さなドラフトモデルを使ってトークンを提案し、それをより … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Token-Driven GammaTune: Adaptive Calibration for Enhanced Speculative Decoding はコメントを受け付けていません

How to Train Long-Context Language Models (Effectively)

要約 我々は、ロングコンテクスト情報を効果的に利用するための言語モデル(LM)の … 続きを読む

カテゴリー: cs.CL, cs.LG | How to Train Long-Context Language Models (Effectively) はコメントを受け付けていません

Efficient LLM Inference using Dynamic Input Pruning and Cache-Aware Masking

要約 モバイル・デバイスの計算能力はますます向上しているが、DRAM帯域幅の改善 … 続きを読む

カテゴリー: cs.CL, cs.LG | Efficient LLM Inference using Dynamic Input Pruning and Cache-Aware Masking はコメントを受け付けていません

Multi-Modal Framing Analysis of News

要約 政治的コミュニケーションの自動フレーム分析は、計算社会科学において人気のあ … 続きを読む

カテゴリー: cs.CL, cs.CY, cs.LG | Multi-Modal Framing Analysis of News はコメントを受け付けていません

Reasoning Inconsistencies and How to Mitigate Them in Deep Learning

要約 近年のディープラーニングモデルと技術の進歩により、多様なタスクやモダリティ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.LO | Reasoning Inconsistencies and How to Mitigate Them in Deep Learning はコメントを受け付けていません

Knowledge Graph Completion with Mixed Geometry Tensor Factorization

要約 本論文では、低ランクテンソル近似による知識グラフ補完のための新しい幾何学的 … 続きを読む

カテゴリー: cs.AI, cs.IR, cs.LG, stat.ML | Knowledge Graph Completion with Mixed Geometry Tensor Factorization はコメントを受け付けていません

Iterated $Q$-Network: Beyond One-Step Bellman Updates in Deep Reinforcement Learning

要約 強化学習法の大部分は、作用値関数の効果的な推定を得るために必要な計算量とデ … 続きを読む

カテゴリー: cs.AI, cs.LG | Iterated $Q$-Network: Beyond One-Step Bellman Updates in Deep Reinforcement Learning はコメントを受け付けていません

Improving Counterfactual Truthfulness for Molecular Property Prediction through Uncertainty Quantification

要約 説明可能なAI(xAI)の介入は、複雑なブラックボックスモデルの解釈可能性 … 続きを読む

カテゴリー: cs.AI, cs.LG | Improving Counterfactual Truthfulness for Molecular Property Prediction through Uncertainty Quantification はコメントを受け付けていません

Learning Geometrically-Informed Lyapunov Functions with Deep Diffeomorphic RBF Networks

要約 学習ベースの自律システムの実用化には、データから証明関数の形で安全保証を柔 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.SY, eess.SY | Learning Geometrically-Informed Lyapunov Functions with Deep Diffeomorphic RBF Networks はコメントを受け付けていません