-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Think Before You Segment: High-Quality Reasoning Segmentation with GPT Chain of Thoughts
要約 推論セグメンテーションは、複雑で暗黙的な、さらには非視覚クエリテキストに関 … 続きを読む
カテゴリー: cs.CV
Think Before You Segment: High-Quality Reasoning Segmentation with GPT Chain of Thoughts はコメントを受け付けていません
ADROIT: A Self-Supervised Framework for Learning Robust Representations for Active Learning
要約 Active Learningは、ラベル付けに最適なサンプルを選択し、注釈 … 続きを読む
PE3R: Perception-Efficient 3D Reconstruction
要約 2Dから3Dの認識における最近の進歩により、2D画像からの3Dシーンの理解 … 続きを読む
カテゴリー: cs.CV
PE3R: Perception-Efficient 3D Reconstruction はコメントを受け付けていません
PointVLA: Injecting the 3D World into Vision-Language-Action Models
要約 Vision-Language-action(VLA)モデルは、大規模な2 … 続きを読む
CPAny: Couple With Any Encoder to Refer Multi-Object Tracking
要約 参照マルチオブジェクト追跡(RMOT)は、ビデオの自然言語表現によって指定 … 続きを読む
カテゴリー: cs.CV
CPAny: Couple With Any Encoder to Refer Multi-Object Tracking はコメントを受け付けていません
FastInstShadow: A Simple Query-Based Model for Instance Shadow Detection
要約 インスタンスシャドウ検出は、既存のメソッドが最初に影とオブジェクトを独立し … 続きを読む
カテゴリー: cs.CV
FastInstShadow: A Simple Query-Based Model for Instance Shadow Detection はコメントを受け付けていません
From Limited Labels to Open Domains: An Efficient Learning Paradigm for UAV-view Geo-Localization
要約 従来のUAV-Viewジオローカリゼーション(UVGL)監視されたパラダイ … 続きを読む
VisRL: Intention-Driven Visual Perception via Reinforced Reasoning
要約 視覚的理解は本質的に意図駆動型です – 人間は目標に基づいてシ … 続きを読む
Physics Context Builders: A Modular Framework for Physical Reasoning in Vision-Language Models
要約 動的環境内でオブジェクトの動作を解釈することを含む物理的推論は、ビジョン言 … 続きを読む
LBM: Latent Bridge Matching for Fast Image-to-Image Translation
要約 このホワイトペーパーでは、潜在的な汎用性のあるスケーラブルな方法である潜在 … 続きを読む
カテゴリー: cs.CV
LBM: Latent Bridge Matching for Fast Image-to-Image Translation はコメントを受け付けていません