月別アーカイブ: 2025年2月

Agentic Reward Modeling: Integrating Human Preferences with Verifiable Correctness Signals for Reliable Reward Systems

投稿日: 2025年2月27日作成者: jarxiv

要約報酬モデル（RMS）は、大規模な言語モデル（LLM）のトレーニングと推論時 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Modality Interactive Mixture-of-Experts for Fake News Detection

投稿日: 2025年2月27日作成者: jarxiv

要約ソーシャルメディアプラットフォームでの偽のニュースの拡散は、脆弱な集団に不 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, I.2.4 | コメントを受け付けていません

Joint Optimal Transport and Embedding for Network Alignment

投稿日: 2025年2月27日作成者: jarxiv

要約さまざまなネットワーク全体でノード対応を見つけることを目的としたネットワー … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.SI | コメントを受け付けていません

Wasserstein Distances, Neuronal Entanglement, and Sparsity

投稿日: 2025年2月27日作成者: jarxiv

要約不浸透性ポリマンティックニューロンは、大規模な言語モデルの解釈可能性に対す … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Provable Acceleration for Diffusion Models under Minimal Assumptions

投稿日: 2025年2月27日作成者: jarxiv

要約スコアベースの拡散モデルは、サンプリングに最小限の最適性を達成しますが、ス … 続きを読む →

カテゴリー: cs.AI, cs.LG, math.OC, stat.ML | コメントを受け付けていません

Controlled Diversity: Length-optimized Natural Language Generation

投稿日: 2025年2月27日作成者: jarxiv

要約 LLMは一般に、厳密な長さの要件に基づいて出力の長さを調整することはできま … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Energy-Efficient Transformer Inference: Optimization Strategies for Time Series Classification

投稿日: 2025年2月27日作成者: jarxiv

要約時系列分類におけるトランスモデルの計算需要の増加は、エネルギー効率の高い展 … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.PF | コメントを受け付けていません

The Hyperfitting Phenomenon: Sharpening and Stabilizing LLMs for Open-Ended Text Generation

投稿日: 2025年2月27日作成者: jarxiv

要約このペーパーでは、非常に小さなデータセットに事前に訓練された大型言語モデル … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Physics-Based Hybrid Machine Learning for Critical Heat Flux Prediction with Uncertainty Quantification

投稿日: 2025年2月27日作成者: jarxiv

要約臨界熱流束は、熱伝達と成分の温度と性能への影響により、沸騰システムモデリン … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

DataMan: Data Manager for Pre-training Large Language Models

投稿日: 2025年2月27日作成者: jarxiv

要約データのスケーリング法則によって駆動される大規模な言語モデル（LLM）のパ … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

月別アーカイブ: 2025年2月

Agentic Reward Modeling: Integrating Human Preferences with Verifiable Correctness Signals for Reliable Reward Systems

Modality Interactive Mixture-of-Experts for Fake News Detection

Joint Optimal Transport and Embedding for Network Alignment

Wasserstein Distances, Neuronal Entanglement, and Sparsity

Provable Acceleration for Diffusion Models under Minimal Assumptions

Controlled Diversity: Length-optimized Natural Language Generation

Energy-Efficient Transformer Inference: Optimization Strategies for Time Series Classification

The Hyperfitting Phenomenon: Sharpening and Stabilizing LLMs for Open-Ended Text Generation

Physics-Based Hybrid Machine Learning for Critical Heat Flux Prediction with Uncertainty Quantification

DataMan: Data Manager for Pre-training Large Language Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー