-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「I.2.10」カテゴリーアーカイブ
A self-supervised cyclic neural-analytic approach for novel view synthesis and 3D reconstruction
要約 録画されたビデオから新しいビューを生成することは、自律的なUAVナビゲーシ … 続きを読む
Fast 3D point clouds retrieval for Large-scale 3D Place Recognition
要約 3Dポイントクラウドでの検索は、3Dポイントの参照内で最も類似したポイント … 続きを読む
Accelerating Model-Based Reinforcement Learning with State-Space World Models
要約 強化学習(RL)は、ロボット学習の強力なアプローチです。 ただし、モデルフ … 続きを読む
Physics-informed Variational Autoencoders for Improved Robustness to Environmental Factors of Variation
要約 機械学習モデルと物理モデルの組み合わせは、堅牢なデータ表現を学習するための … 続きを読む
A Lightweight and Extensible Cell Segmentation and Classification Model for Whole Slide Images
要約 デジタル病理学における臨床的に有用な細胞レベル分析ツールの開発ツールの開発 … 続きを読む
iTrash: Incentivized Token Rewards for Automated Sorting and Handling
要約 ロボットシステム(RS)がより自律的になるにつれて、クリーニング、インフラ … 続きを読む
Unveiling the Potential of iMarkers: Invisible Fiducial Markers for Advanced Robotics
要約 Fiducialマーカーは、さまざまなロボットタスクで広く使用されており、 … 続きを読む
MOVE: A Mixture-of-Vision-Encoders Approach for Domain-Focused Vision-Language Processing
要約 マルチモーダル言語モデル(MLMS)は、特定のアダプターを介してビジョンエ … 続きを読む
RGB-Only Gaussian Splatting SLAM for Unbounded Outdoor Scenes
要約 3Dガウススプラッティング(3DG)は、高忠実度の斬新な見解を生み出すこと … 続きを読む
GroundCap: A Visually Grounded Image Captioning Dataset
要約 現在の画像キャプションシステムには、説明テキストを特定の視覚要素にリンクす … 続きを読む