-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
LaRI: Layered Ray Intersections for Single-view 3D Geometric Reasoning
要約 単一の画像から目に見えないジオメトリの推論のための新しい方法である層状光線 … 続きを読む
カテゴリー: cs.CV
LaRI: Layered Ray Intersections for Single-view 3D Geometric Reasoning はコメントを受け付けていません
SpINR: Neural Volumetric Reconstruction for FMCW Radars
要約 この論文では、周波数調整連続波(FMCW)レーダーデータを使用した体積再構 … 続きを読む
カテゴリー: cs.CV
SpINR: Neural Volumetric Reconstruction for FMCW Radars はコメントを受け付けていません
Nearly isotropic segmentation for medial temporal lobe subregions in multi-modality MRI
要約 脳MRIにおける内側側頭葉(MTL)サブ領域の形態計測は、アルツハイマー病 … 続きを読む
Understanding Depth and Height Perception in Large Visual-Language Models
要約 幾何学的理解 – 深さと身長の知覚を含む – は、 … 続きを読む
カテゴリー: cs.CV
Understanding Depth and Height Perception in Large Visual-Language Models はコメントを受け付けていません
Iterative Event-based Motion Segmentation by Variational Contrast Maximization
要約 イベントカメラは、シーンの変化に応答するため、モーション推定に適した豊富な … 続きを読む
NoiseController: Towards Consistent Multi-view Video Generation via Noise Decomposition and Collaboration
要約 高品質のビデオ生成は、映画産業や自律運転など、多くの分野で重要です。 ただ … 続きを読む
カテゴリー: cs.CV
NoiseController: Towards Consistent Multi-view Video Generation via Noise Decomposition and Collaboration はコメントを受け付けていません
Fast-Slow Thinking for Large Vision-Language Model Reasoning
要約 大規模なビジョン言語モデル(LVLMS)の最近の進歩により、\ texti … 続きを読む
RGS-DR: Reflective Gaussian Surfels with Deferred Rendering for Shiny Objects
要約 RGS-DRを紹介します。RGS-DRは、柔軟なレリフトとシーンの編集をサ … 続きを読む
カテゴリー: cs.CV
RGS-DR: Reflective Gaussian Surfels with Deferred Rendering for Shiny Objects はコメントを受け付けていません
Rethinking Few-Shot Image Fusion: Granular Ball Priors Enable General-Purpose Deep Fusion
要約 画像融合タスクでは、プライアーとしての実際の融合画像が存在しないことは、基 … 続きを読む
DCFormer: Efficient 3D Vision-Language Modeling with Decomposed Convolutions
要約 ビジョン言語モデル(VLM)は、視覚的表現とテキスト表現を整列させる能力に … 続きを読む
カテゴリー: cs.CV
DCFormer: Efficient 3D Vision-Language Modeling with Decomposed Convolutions はコメントを受け付けていません