-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.LG」カテゴリーアーカイブ
On the (Non) Injectivity of Piecewise Linear Janossy Pooling
要約 マルチセットをベクトルにマッピングする関数であるマルチセット関数は、マルチ … 続きを読む
Prismatic Synthesis: Gradient-based Data Diversification Boosts Generalization in LLM Reasoning
要約 言語モデルの効果的な一般化は、トレーニングデータの多様性に大きく依存します … 続きを読む
From Alignment to Advancement: Bootstrapping Audio-Language Alignment with Synthetic Data
要約 オーディオ認識の大規模な言語モデル(ALLMS)は、最近、オーディオ入力を … 続きを読む
Temporal Sampling for Forgotten Reasoning in LLMs
要約 大型言語モデル(LLMS)の微調整は、推論能力を改善することを目的としてい … 続きを読む
Parameter-Efficient Fine-Tuning with Column Space Projection
要約 最小限の計算オーバーヘッドで大規模な言語モデル(LLMS)を微調整すること … 続きを読む
From What to How: Attributing CLIP’s Latent Components Reveals Unexpected Semantic Reliance
要約 トランスベースのクリップモデルは、テキストイメージの調査と特徴抽出に広く使 … 続きを読む
Variational Deep Learning via Implicit Regularization
要約 現代のディープラーニングモデルは、明示的な正則化をほとんどまたはまったくな … 続きを読む
DreamPRM: Domain-Reweighted Process Reward Model for Multimodal Reasoning
要約 推論により、複雑なタスクでの大規模な言語モデル(LLMS)のパフォーマンス … 続きを読む
Human-Aligned Image Models Improve Visual Decoding from the Brain
要約 脳活動からの視覚画像を解読することは、脳コンピューターの相互作用を進め、人 … 続きを読む
ViTaPEs: Visuotactile Position Encodings for Cross-Modal Alignment in Multimodal Transformers
要約 触覚センシングは、テクスチャ、コンプライアンス、力などの視覚的知覚を補完す … 続きを読む