「cs.AI」カテゴリーアーカイブ

Target Networks and Over-parameterization Stabilize Off-policy Bootstrapping with Function Approximation

投稿日: 2024年6月3日作成者: jarxiv

要約ターゲットネットワークと過剰パラメータ化された線形関数近似の組み合わせに … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Exploratory Preference Optimization: Harnessing Implicit Q*-Approximation for Sample-Efficient RLHF

投稿日: 2024年6月3日作成者: jarxiv

要約ヒューマンフィードバックからの強化学習 (RLHF) は、言語モデルの調 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, stat.ML | コメントを受け付けていません

Grammar-Aligned Decoding

投稿日: 2024年6月3日作成者: jarxiv

要約大規模言語モデル (LLM) は、プログラムコード、数式、整形式のマーク … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Generalization or Memorization: Data Contamination and Trustworthy Evaluation for Large Language Models

投稿日: 2024年6月3日作成者: jarxiv

要約大規模言語モデル (LLM) の優れた機能に関する最近の声明は、通常、オー … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG, cs.SE | コメントを受け付けていません

Neural Network Verification with Branch-and-Bound for General Nonlinearities

投稿日: 2024年6月3日作成者: jarxiv

要約分枝限定 (BaB) は、ニューラルネットワーク (NN) 検証に最も効 … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Recurrent neural networks: vanishing and exploding gradients are not the end of the story

投稿日: 2024年6月3日作成者: jarxiv

要約リカレントニューラルネットワーク (RNN) は、主に勾配の消失と爆発 … 続きを読む →

カテゴリー: cs.AI, cs.LG, math.OC | コメントを受け付けていません

Mamba: Linear-Time Sequence Modeling with Selective State Spaces

投稿日: 2024年6月3日作成者: jarxiv

要約現在、深層学習におけるエキサイティングなアプリケーションのほとんどを強化し … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Code Pretraining Improves Entity Tracking Abilities of Language Models

投稿日: 2024年6月3日作成者: jarxiv

要約最近の研究では、コード上で言語モデルを事前トレーニングすると、自然言語で表 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Attention-aware Semantic Communications for Collaborative Inference

投稿日: 2024年6月3日作成者: jarxiv

要約ビジョントランスフォーマー（ViT）モデルの効率的な使用に焦点を当て、エッ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, eess.SP | コメントを受け付けていません

einspace: Searching for Neural Architectures from Fundamental Operations

投稿日: 2024年6月3日作成者: jarxiv

要約ニューラルアーキテクチャ検索 (NAS) は、特定のタスクに対して高性能 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, stat.ML | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

Target Networks and Over-parameterization Stabilize Off-policy Bootstrapping with Function Approximation

Exploratory Preference Optimization: Harnessing Implicit Q*-Approximation for Sample-Efficient RLHF

Grammar-Aligned Decoding

Generalization or Memorization: Data Contamination and Trustworthy Evaluation for Large Language Models

Neural Network Verification with Branch-and-Bound for General Nonlinearities

Recurrent neural networks: vanishing and exploding gradients are not the end of the story

Mamba: Linear-Time Sequence Modeling with Selective State Spaces

Code Pretraining Improves Entity Tracking Abilities of Language Models

Attention-aware Semantic Communications for Collaborative Inference

einspace: Searching for Neural Architectures from Fundamental Operations

最近の投稿

最近のコメント

アーカイブ

カテゴリー