-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.LG」カテゴリーアーカイブ
Sim-and-Real Co-Training: A Simple Recipe for Vision-Based Robotic Manipulation
要約 大規模な現実世界のロボットデータセットは、ジェネラリストのロボットモデルを … 続きを読む
Which LIME should I trust? Concepts, Challenges, and Solutions
要約 ニューラルネットワークが必須システムで支配的になるにつれて、説明可能な人工 … 続きを読む
Effectively Controlling Reasoning Models through Thinking Intervention
要約 推論強化された大手言語モデル(LLMS)は、最終回答を生成する前に中間推論 … 続きを読む
RIG: Synergizing Reasoning and Imagination in End-to-End Generalist Policy
要約 アクションの前に推論し、潜在的な結果(つまり、世界モデル)を想像することは … 続きを読む
From Colors to Classes: Emergence of Concepts in Vision Transformers
要約 ビジョントランス(VITS)は、強力な表現能力により、さまざまなコンピュー … 続きを読む
IMPACT: A Generic Semantic Loss for Multimodal Medical Image Registration
要約 画像登録は医療イメージングの基本であり、診断、治療計画、画像誘導治療、また … 続きを読む
It’s a (Blind) Match! Towards Vision-Language Correspondence without Parallel Data
要約 プラトニック表現仮説は、モデルとデータセットのサイズが増加するにつれて、ビ … 続きを読む
DICE: Discrete Inversion Enabling Controllable Editing for Multinomial Diffusion and Masked Generative Models
要約 離散拡散モデルは、画像生成やマスクされた言語モデリングなどのタスクで成功を … 続きを読む
MB-ORES: A Multi-Branch Object Reasoner for Visual Grounding in Remote Sensing
要約 リモートセンシング(RS)画像のオブジェクト検出(OD)と視覚的接地(VG … 続きを読む