「cs.AI」カテゴリーアーカイブ

TIFeD: a Tiny Integer-based Federated learning algorithm with Direct feedback alignment

投稿日: 2024年11月26日作成者: jarxiv

要約極度にリソースに制約のあるデバイス上で機械および深層学習モデルを直接トレー … 続きを読む →

カテゴリー: cs.AI, cs.LG, I.2.6 | コメントを受け付けていません

Interpolating neural network: A novel unification of machine learning and interpolation theory

投稿日: 2024年11月26日作成者: jarxiv

要約人工知能 (AI) はソフトウェア開発に革命をもたらし、タスク固有のコード … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.NE | コメントを受け付けていません

Characterized Diffusion Networks for Enhanced Autonomous Driving Trajectory Prediction

投稿日: 2024年11月26日作成者: jarxiv

要約この論文では、動的で異種の交通環境によってもたらされる課題に対処するために … 続きを読む →

カテゴリー: cs.AI, cs.RO | コメントを受け付けていません

Can Learned Optimization Make Reinforcement Learning Less Difficult?

投稿日: 2024年11月26日作成者: jarxiv

要約強化学習 (RL) は現実世界での意思決定に大きな可能性を秘めていますが、 … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Tuning Synaptic Connections instead of Weights by Genetic Algorithm in Spiking Policy Network

投稿日: 2024年11月26日作成者: jarxiv

要約相互作用から学習することは、生物学的因子が環境と自分自身についての知識を獲 … 続きを読む →

カテゴリー: cs.AI, cs.NE | コメントを受け付けていません

OffLight: An Offline Multi-Agent Reinforcement Learning Framework for Traffic Signal Control

投稿日: 2024年11月26日作成者: jarxiv

要約効率的な交通制御 (TSC) は都市のモビリティにとって不可欠ですが、従来 … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.MA | コメントを受け付けていません

When Babies Teach Babies: Can student knowledge sharing outperform Teacher-Guided Distillation on small datasets?

投稿日: 2024年11月26日作成者: jarxiv

要約データ効率の高い言語モデルの事前トレーニングの限界を押し上げることを目的と … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

O1 Replication Journey — Part 2: Surpassing O1-preview through Simple Distillation, Big Progress or Bitter Lesson?

投稿日: 2024年11月26日作成者: jarxiv

要約このペーパーでは、OpenAI の O1 モデル機能を複製するための現在の … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Interpreting Language Reward Models via Contrastive Explanations

投稿日: 2024年11月26日作成者: jarxiv

要約報酬モデル (RM) は、大規模言語モデル (LLM) の出力を人間の価値 … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Fundamental Limits of Prompt Tuning Transformers: Universality, Capacity and Efficiency

投稿日: 2024年11月26日作成者: jarxiv

要約変圧器ベースの基礎モデルの即時調整の統計的および計算上の限界を調査します。 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, stat.ML | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

TIFeD: a Tiny Integer-based Federated learning algorithm with Direct feedback alignment

Interpolating neural network: A novel unification of machine learning and interpolation theory

Characterized Diffusion Networks for Enhanced Autonomous Driving Trajectory Prediction

Can Learned Optimization Make Reinforcement Learning Less Difficult?

Tuning Synaptic Connections instead of Weights by Genetic Algorithm in Spiking Policy Network

OffLight: An Offline Multi-Agent Reinforcement Learning Framework for Traffic Signal Control

When Babies Teach Babies: Can student knowledge sharing outperform Teacher-Guided Distillation on small datasets?

O1 Replication Journey — Part 2: Surpassing O1-preview through Simple Distillation, Big Progress or Bitter Lesson?

Interpreting Language Reward Models via Contrastive Explanations

Fundamental Limits of Prompt Tuning Transformers: Universality, Capacity and Efficiency

最近の投稿

最近のコメント

アーカイブ

カテゴリー