cs.LG」カテゴリーアーカイブ

Differentiable Quantum Architecture Search in Asynchronous Quantum Reinforcement Learning

要約 量子強化学習 (QRL) の出現は、特に変分量子回路 (VQC) 上に構築 … 続きを読む

カテゴリー: cs.AI, cs.DC, cs.LG, cs.NE, quant-ph | Differentiable Quantum Architecture Search in Asynchronous Quantum Reinforcement Learning はコメントを受け付けていません

When Linear Attention Meets Autoregressive Decoding: Towards More Effective and Efficient Linearized Large Language Models

要約 自己回帰大規模言語モデル (LLM) は、言語タスクで目覚ましいパフォーマ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | When Linear Attention Meets Autoregressive Decoding: Towards More Effective and Efficient Linearized Large Language Models はコメントを受け付けていません

ShiftAddViT: Mixture of Multiplication Primitives Towards Efficient Vision Transformer

要約 ビジョン トランスフォーマー (ViT) は優れたパフォーマンスを示し、複 … 続きを読む

カテゴリー: cs.AI, cs.LG | ShiftAddViT: Mixture of Multiplication Primitives Towards Efficient Vision Transformer はコメントを受け付けていません

ShiftAddLLM: Accelerating Pretrained LLMs via Post-Training Multiplication-Less Reparameterization

要約 大規模言語モデル (LLM) は、言語タスクで優れたパフォーマンスを示して … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | ShiftAddLLM: Accelerating Pretrained LLMs via Post-Training Multiplication-Less Reparameterization はコメントを受け付けていません

Exploring Scaling Trends in LLM Robustness

要約 言語モデルの機能は、モデルのサイズとトレーニング データをスケーリングする … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG, I.2.7 | Exploring Scaling Trends in LLM Robustness はコメントを受け付けていません

Recursive Introspection: Teaching Language Model Agents How to Self-Improve

要約 基礎モデルでインテリジェントなエージェントの動作を可能にするための中心的な … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Recursive Introspection: Teaching Language Model Agents How to Self-Improve はコメントを受け付けていません

LoRA-Pro: Are Low-Rank Adapters Properly Optimized?

要約 LoRA としても知られる低ランク適応は、元の行列を 2 つの低ランク行列 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | LoRA-Pro: Are Low-Rank Adapters Properly Optimized? はコメントを受け付けていません

Network Inversion of Convolutional Neural Nets

要約 ニューラル ネットワークは、さまざまなアプリケーションにわたる強力なツール … 続きを読む

カテゴリー: cs.CV, cs.LG | Network Inversion of Convolutional Neural Nets はコメントを受け付けていません

HVM-1: Large-scale video models pretrained with nearly 5000 hours of human-like video data

要約 私たちは、時空間マスクされたオートエンコーダー (ST- MAE) アルゴ … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.NE, q-bio.NC | HVM-1: Large-scale video models pretrained with nearly 5000 hours of human-like video data はコメントを受け付けていません

3D Diffuser Actor: Policy Diffusion with 3D Scene Representations

要約 拡散ポリシーは、ロボットと環境の状態を条件としてロボットの動作分布を学習す … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | 3D Diffuser Actor: Policy Diffusion with 3D Scene Representations はコメントを受け付けていません