-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.LG」カテゴリーアーカイブ
Accelerated Training through Iterative Gradient Propagation Along the Residual Path
要約 深い学習の礎であるにもかかわらず、バックプロパゲーションは、非常に深いモデ … 続きを読む
カテゴリー: cs.LG
Accelerated Training through Iterative Gradient Propagation Along the Residual Path はコメントを受け付けていません
Solving Roughly Forced Nonlinear PDEs via Misspecified Kernel Methods and Neural Networks
要約 ガウスプロセス(GPS)またはニューラルネットワーク(NNS)を使用して、 … 続きを読む
Unlocking Transparent Alignment Through Enhanced Inverse Constitutional AI for Principle Extraction
要約 人間のフィードバック(RLHF)や直接選好最適化(DPO)からの強化学習な … 続きを読む
カテゴリー: cs.LG
Unlocking Transparent Alignment Through Enhanced Inverse Constitutional AI for Principle Extraction はコメントを受け付けていません
Evidence on the Regularisation Properties of Maximum-Entropy Reinforcement Learning
要約 最大エンゴロピー強化学習を通じて学習したポリシーの一般化と堅牢性の特性は、 … 続きを読む
カテゴリー: cs.LG
Evidence on the Regularisation Properties of Maximum-Entropy Reinforcement Learning はコメントを受け付けていません
Convergence of two-timescale gradient descent ascent dynamics: finite-dimensional and mean-field perspectives
要約 ツータイムスケール勾配降下(GDA)は、MIN-MAXゲームでNASH平衡 … 続きを読む
CoRe-Net: Co-Operational Regressor Network with Progressive Transfer Learning for Blind Radar Signal Restoration
要約 実世界のレーダー信号は、センサーノイズ、エコー、干渉、意図的な詰まり、タイ … 続きを読む
カテゴリー: cs.LG
CoRe-Net: Co-Operational Regressor Network with Progressive Transfer Learning for Blind Radar Signal Restoration はコメントを受け付けていません
Scanning Trojaned Models Using Out-of-Distribution Samples
要約 深いニューラルネットワークでのトロイの木馬(バックドア)のスキャンは、実世 … 続きを読む
カテゴリー: cs.LG
Scanning Trojaned Models Using Out-of-Distribution Samples はコメントを受け付けていません
Refusal in LLMs is an Affine Function
要約 アクティベーションに直接介入することにより、言語モデルの動作を操縦するため … 続きを読む
SLIM: Let LLM Learn More and Forget Less with Soft LoRA and Identity Mixture
要約 多くの努力がなされていますが、多くのアプリケーションでのトレーニング予算、 … 続きを読む
Over-Tokenized Transformer: Vocabulary is Generally Worth Scaling
要約 トークン化は大規模な言語モデル(LLM)の基本的なコンポーネントですが、モ … 続きを読む