cs.AI」カテゴリーアーカイブ

TIFeD: a Tiny Integer-based Federated learning algorithm with Direct feedback alignment

要約 極度にリソースに制約のあるデバイス上で機械および深層学習モデルを直接トレー … 続きを読む

カテゴリー: cs.AI, cs.LG, I.2.6 | TIFeD: a Tiny Integer-based Federated learning algorithm with Direct feedback alignment はコメントを受け付けていません

Interpolating neural network: A novel unification of machine learning and interpolation theory

要約 人工知能 (AI) はソフトウェア開発に革命をもたらし、タスク固有のコード … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.NE | Interpolating neural network: A novel unification of machine learning and interpolation theory はコメントを受け付けていません

Characterized Diffusion Networks for Enhanced Autonomous Driving Trajectory Prediction

要約 この論文では、動的で異種の交通環境によってもたらされる課題に対処するために … 続きを読む

カテゴリー: cs.AI, cs.RO | Characterized Diffusion Networks for Enhanced Autonomous Driving Trajectory Prediction はコメントを受け付けていません

Can Learned Optimization Make Reinforcement Learning Less Difficult?

要約 強化学習 (RL) は現実世界での意思決定に大きな可能性を秘めていますが、 … 続きを読む

カテゴリー: cs.AI, cs.LG | Can Learned Optimization Make Reinforcement Learning Less Difficult? はコメントを受け付けていません

Tuning Synaptic Connections instead of Weights by Genetic Algorithm in Spiking Policy Network

要約 相互作用から学習することは、生物学的因子が環境と自分自身についての知識を獲 … 続きを読む

カテゴリー: cs.AI, cs.NE | Tuning Synaptic Connections instead of Weights by Genetic Algorithm in Spiking Policy Network はコメントを受け付けていません

OffLight: An Offline Multi-Agent Reinforcement Learning Framework for Traffic Signal Control

要約 効率的な交通制御 (TSC) は都市のモビリティにとって不可欠ですが、従来 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.MA | OffLight: An Offline Multi-Agent Reinforcement Learning Framework for Traffic Signal Control はコメントを受け付けていません

When Babies Teach Babies: Can student knowledge sharing outperform Teacher-Guided Distillation on small datasets?

要約 データ効率の高い言語モデルの事前トレーニングの限界を押し上げることを目的と … 続きを読む

カテゴリー: cs.AI, cs.CL | When Babies Teach Babies: Can student knowledge sharing outperform Teacher-Guided Distillation on small datasets? はコメントを受け付けていません

O1 Replication Journey — Part 2: Surpassing O1-preview through Simple Distillation, Big Progress or Bitter Lesson?

要約 このペーパーでは、OpenAI の O1 モデル機能を複製するための現在の … 続きを読む

カテゴリー: cs.AI, cs.CL | O1 Replication Journey — Part 2: Surpassing O1-preview through Simple Distillation, Big Progress or Bitter Lesson? はコメントを受け付けていません

Interpreting Language Reward Models via Contrastive Explanations

要約 報酬モデル (RM) は、大規模言語モデル (LLM) の出力を人間の価値 … 続きを読む

カテゴリー: cs.AI, cs.LG | Interpreting Language Reward Models via Contrastive Explanations はコメントを受け付けていません

Fundamental Limits of Prompt Tuning Transformers: Universality, Capacity and Efficiency

要約 変圧器ベースの基礎モデルの即時調整の統計的および計算上の限界を調査します。 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, stat.ML | Fundamental Limits of Prompt Tuning Transformers: Universality, Capacity and Efficiency はコメントを受け付けていません