cs.AI」カテゴリーアーカイブ

Target Networks and Over-parameterization Stabilize Off-policy Bootstrapping with Function Approximation

要約 ターゲット ネットワークと過剰パラメータ化された線形関数近似の組み合わせに … 続きを読む

カテゴリー: cs.AI, cs.LG | Target Networks and Over-parameterization Stabilize Off-policy Bootstrapping with Function Approximation はコメントを受け付けていません

Exploratory Preference Optimization: Harnessing Implicit Q*-Approximation for Sample-Efficient RLHF

要約 ヒューマン フィードバックからの強化学習 (RLHF) は、言語モデルの調 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, stat.ML | Exploratory Preference Optimization: Harnessing Implicit Q*-Approximation for Sample-Efficient RLHF はコメントを受け付けていません

Grammar-Aligned Decoding

要約 大規模言語モデル (LLM) は、プログラム コード、数式、整形式のマーク … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Grammar-Aligned Decoding はコメントを受け付けていません

Generalization or Memorization: Data Contamination and Trustworthy Evaluation for Large Language Models

要約 大規模言語モデル (LLM) の優れた機能に関する最近の声明は、通常、オー … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG, cs.SE | Generalization or Memorization: Data Contamination and Trustworthy Evaluation for Large Language Models はコメントを受け付けていません

Neural Network Verification with Branch-and-Bound for General Nonlinearities

要約 分枝限定 (BaB) は、ニューラル ネットワーク (NN) 検証に最も効 … 続きを読む

カテゴリー: cs.AI, cs.LG | Neural Network Verification with Branch-and-Bound for General Nonlinearities はコメントを受け付けていません

Recurrent neural networks: vanishing and exploding gradients are not the end of the story

要約 リカレント ニューラル ネットワーク (RNN) は、主に勾配の消失と爆発 … 続きを読む

カテゴリー: cs.AI, cs.LG, math.OC | Recurrent neural networks: vanishing and exploding gradients are not the end of the story はコメントを受け付けていません

Mamba: Linear-Time Sequence Modeling with Selective State Spaces

要約 現在、深層学習におけるエキサイティングなアプリケーションのほとんどを強化し … 続きを読む

カテゴリー: cs.AI, cs.LG | Mamba: Linear-Time Sequence Modeling with Selective State Spaces はコメントを受け付けていません

Code Pretraining Improves Entity Tracking Abilities of Language Models

要約 最近の研究では、コード上で言語モデルを事前トレーニングすると、自然言語で表 … 続きを読む

カテゴリー: cs.AI, cs.CL | Code Pretraining Improves Entity Tracking Abilities of Language Models はコメントを受け付けていません

Attention-aware Semantic Communications for Collaborative Inference

要約 ビジョントランスフォーマー(ViT)モデルの効率的な使用に焦点を当て、エッ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, eess.SP | Attention-aware Semantic Communications for Collaborative Inference はコメントを受け付けていません

einspace: Searching for Neural Architectures from Fundamental Operations

要約 ニューラル アーキテクチャ検索 (NAS) は、特定のタスクに対して高性能 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, stat.ML | einspace: Searching for Neural Architectures from Fundamental Operations はコメントを受け付けていません