cs.AI」カテゴリーアーカイブ

NdLinear: Don’t Flatten! Building Superior Neural Architectures by Preserving N-D Structure

要約 多くの衝撃的な機械学習タスクには、画像、体積医療スキャン、多変量の時系列な … 続きを読む

カテゴリー: cs.AI, cs.LG | NdLinear: Don’t Flatten! Building Superior Neural Architectures by Preserving N-D Structure はコメントを受け付けていません

‘Give Me BF16 or Give Me Death’? Accuracy-Performance Trade-Offs in LLM Quantization

要約 量子化は、大規模な言語モデル(LLM)の推論を加速するための強力なツールで … 続きを読む

カテゴリー: cs.AI, cs.LG | ‘Give Me BF16 or Give Me Death’? Accuracy-Performance Trade-Offs in LLM Quantization はコメントを受け付けていません

RuleArena: A Benchmark for Rule-Guided Reasoning with LLMs in Real-World Scenarios

要約 このペーパーでは、Rulearenaを紹介します。これは、推論において複雑 … 続きを読む

カテゴリー: cs.AI, cs.CL | RuleArena: A Benchmark for Rule-Guided Reasoning with LLMs in Real-World Scenarios はコメントを受け付けていません

MiCRo: Mixture Modeling and Context-aware Routing for Personalized Preference Learning

要約 報酬モデリングは、大規模な言語モデル(LLM)を調整するために人間のフィー … 続きを読む

カテゴリー: cs.AI, cs.CL | MiCRo: Mixture Modeling and Context-aware Routing for Personalized Preference Learning はコメントを受け付けていません

Harnessing Negative Signals: Reinforcement Distillation from Teacher Data for LLM Reasoning

要約 モデルの蒸留の最近の進歩は、高度な推論モデルからのデータ(例:Deepse … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, I.2.6 | Harnessing Negative Signals: Reinforcement Distillation from Teacher Data for LLM Reasoning はコメントを受け付けていません

DexMachina: Functional Retargeting for Bimanual Dexterous Manipulation

要約 機能的なリターゲティングの問題を研究しています。人間の手観察デモからオブジ … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | DexMachina: Functional Retargeting for Bimanual Dexterous Manipulation はコメントを受け付けていません

LlamaDuo: LLMOps Pipeline for Seamless Migration from Service LLMs to Small-Scale Local LLMs

要約 クラウドベースの独自の大規模言語モデル(LLMS)の広範な採用により、運用 … 続きを読む

カテゴリー: cs.AI, cs.DC, cs.LG | LlamaDuo: LLMOps Pipeline for Seamless Migration from Service LLMs to Small-Scale Local LLMs はコメントを受け付けていません

Binarized Neural Networks Converge Toward Algorithmic Simplicity: Empirical Support for the Learning-as-Compression Hypothesis

要約 ニューラルネットワークの情報複雑さの理解と制御は、機械学習の中心的な課題で … 続きを読む

カテゴリー: 68Q30, 68Q32, 68T07, cs.AI, cs.IT, cs.LG, F.1.1, math.IT | Binarized Neural Networks Converge Toward Algorithmic Simplicity: Empirical Support for the Learning-as-Compression Hypothesis はコメントを受け付けていません

ProRL: Prolonged Reinforcement Learning Expands Reasoning Boundaries in Large Language Models

要約 推論中心の言語モデルの最近の進歩により、強化学習(RL)は、検証可能な報酬 … 続きを読む

カテゴリー: cs.AI, cs.CL | ProRL: Prolonged Reinforcement Learning Expands Reasoning Boundaries in Large Language Models はコメントを受け付けていません

HEIE: MLLM-Based Hierarchical Explainable AIGC Image Implausibility Evaluator

要約 AIGC画像はさまざまな分野で普及していますが、アーティファクトや不自然な … 続きを読む

カテゴリー: cs.AI, cs.CV | HEIE: MLLM-Based Hierarchical Explainable AIGC Image Implausibility Evaluator はコメントを受け付けていません