-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
Token-by-Token Regeneration and Domain Biases: A Benchmark of LLMs on Advanced Mathematical Problem-Solving
要約 大規模な言語モデル(LLM)は多くの自然言語タスクで優れていますが、特に象 … 続きを読む
カテゴリー: cs.LG
Token-by-Token Regeneration and Domain Biases: A Benchmark of LLMs on Advanced Mathematical Problem-Solving はコメントを受け付けていません
Accelerated Training through Iterative Gradient Propagation Along the Residual Path
要約 深い学習の礎であるにもかかわらず、バックプロパゲーションは、非常に深いモデ … 続きを読む
カテゴリー: cs.LG
Accelerated Training through Iterative Gradient Propagation Along the Residual Path はコメントを受け付けていません
Solving Roughly Forced Nonlinear PDEs via Misspecified Kernel Methods and Neural Networks
要約 ガウスプロセス(GPS)またはニューラルネットワーク(NNS)を使用して、 … 続きを読む
Unlocking Transparent Alignment Through Enhanced Inverse Constitutional AI for Principle Extraction
要約 人間のフィードバック(RLHF)や直接選好最適化(DPO)からの強化学習な … 続きを読む
カテゴリー: cs.LG
Unlocking Transparent Alignment Through Enhanced Inverse Constitutional AI for Principle Extraction はコメントを受け付けていません
Evidence on the Regularisation Properties of Maximum-Entropy Reinforcement Learning
要約 最大エンゴロピー強化学習を通じて学習したポリシーの一般化と堅牢性の特性は、 … 続きを読む
カテゴリー: cs.LG
Evidence on the Regularisation Properties of Maximum-Entropy Reinforcement Learning はコメントを受け付けていません
Convergence of two-timescale gradient descent ascent dynamics: finite-dimensional and mean-field perspectives
要約 ツータイムスケール勾配降下(GDA)は、MIN-MAXゲームでNASH平衡 … 続きを読む
CoRe-Net: Co-Operational Regressor Network with Progressive Transfer Learning for Blind Radar Signal Restoration
要約 実世界のレーダー信号は、センサーノイズ、エコー、干渉、意図的な詰まり、タイ … 続きを読む
カテゴリー: cs.LG
CoRe-Net: Co-Operational Regressor Network with Progressive Transfer Learning for Blind Radar Signal Restoration はコメントを受け付けていません
Scanning Trojaned Models Using Out-of-Distribution Samples
要約 深いニューラルネットワークでのトロイの木馬(バックドア)のスキャンは、実世 … 続きを読む
カテゴリー: cs.LG
Scanning Trojaned Models Using Out-of-Distribution Samples はコメントを受け付けていません
Refusal in LLMs is an Affine Function
要約 アクティベーションに直接介入することにより、言語モデルの動作を操縦するため … 続きを読む
Panoramic Interests: Stylistic-Content Aware Personalized Headline Generation
要約 パーソナライズされたニュースの見出しの世代は、ユーザーが好みに合わせて調整 … 続きを読む