-
最近の投稿
- BHViT: Binarized Hybrid Vision Transformer
- LION-FS: Fast & Slow Video-Language Thinker as Online Video Assistant
- Chunking the Critic: A Transformer-based Soft Actor-Critic with N-Step Returns
- Decoupled Recommender Systems: Exploring Alternative Recommender Ecosystem Designs
- DongbaMIE: A Multimodal Information Extraction Dataset for Evaluating Semantic Understanding of Dongba Pictograms
-
最近のコメント
表示できるコメントはありません。 cs.AI (34678) cs.CL (26213) cs.CR (2657) cs.CV (40515) cs.LG (39677) cs.RO (20298) cs.SY (3083) eess.IV (4814) eess.SY (3077) stat.ML (5222)
「57R70」カテゴリーアーカイブ
Derivation of effective gradient flow equations and dynamical truncation of training data in Deep Learning
要約 ReLU 活性化関数を使用した深層学習の累積バイアスと重みを制御する明示的 … 続きを読む
On Functional Dimension and Persistent Pseudodimension
要約 固定フィードフォワード ReLU ニューラル ネットワーク アーキテクチャ … 続きを読む
Global $\mathcal{L}^2$ minimization at uniform exponential rate via geometrically adapted gradient descent in Deep Learning
要約 深層学習 (DL) ネットワークにおける教師あり学習のシナリオを検討し、勾 … 続きを読む
Global $\mathcal{L}^2$ minimization at uniform exponential rate via geometrically adapted gradient descent in Deep Learning
要約 深層学習ネットワークで $\mathcal{L}^2$ コスト関数の最小化 … 続きを読む
Geometric structure of Deep Learning networks and construction of global ${\mathcal L}^2$ minimizers
要約 この論文では、パラメータ化されていない深層学習 (DL) ネットワークにお … 続きを読む
Global $\mathcal{L}^2$ minimization at uniform exponential rate via geometrically adapted gradient descent in Deep Learning
要約 深層学習ネットワークで $\mathcal{L}^2$ コスト関数の最小化 … 続きを読む
Geometric structure of Deep Learning networks and construction of global ${\mathcal L}^2$ minimizers
要約 この論文では、$L$ 隠れ層、ランプ活性化関数、${\mathcal L} … 続きを読む