「cs.CV」カテゴリーアーカイブ

LaRI: Layered Ray Intersections for Single-view 3D Geometric Reasoning

投稿日: 2025年4月28日作成者: jarxiv

要約単一の画像から目に見えないジオメトリの推論のための新しい方法である層状光線 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

SpINR: Neural Volumetric Reconstruction for FMCW Radars

投稿日: 2025年4月28日作成者: jarxiv

要約この論文では、周波数調整連続波（FMCW）レーダーデータを使用した体積再構 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Nearly isotropic segmentation for medial temporal lobe subregions in multi-modality MRI

投稿日: 2025年4月28日作成者: jarxiv

要約脳MRIにおける内側側頭葉（MTL）サブ領域の形態計測は、アルツハイマー病 … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Understanding Depth and Height Perception in Large Visual-Language Models

投稿日: 2025年4月28日作成者: jarxiv

要約幾何学的理解 – 深さと身長の知覚を含む – は、 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Iterative Event-based Motion Segmentation by Variational Contrast Maximization

投稿日: 2025年4月28日作成者: jarxiv

要約イベントカメラは、シーンの変化に応答するため、モーション推定に適した豊富な … 続きを読む →

カテゴリー: cs.AI, cs.CV, eess.IV | コメントを受け付けていません

NoiseController: Towards Consistent Multi-view Video Generation via Noise Decomposition and Collaboration

投稿日: 2025年4月28日作成者: jarxiv

要約高品質のビデオ生成は、映画産業や自律運転など、多くの分野で重要です。ただ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Fast-Slow Thinking for Large Vision-Language Model Reasoning

投稿日: 2025年4月28日作成者: jarxiv

要約大規模なビジョン言語モデル（LVLMS）の最近の進歩により、\ texti … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

RGS-DR: Reflective Gaussian Surfels with Deferred Rendering for Shiny Objects

投稿日: 2025年4月28日作成者: jarxiv

要約 RGS-DRを紹介します。RGS-DRは、柔軟なレリフトとシーンの編集をサ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Rethinking Few-Shot Image Fusion: Granular Ball Priors Enable General-Purpose Deep Fusion

投稿日: 2025年4月28日作成者: jarxiv

要約画像融合タスクでは、プライアーとしての実際の融合画像が存在しないことは、基 … 続きを読む →

カテゴリー: cs.CV, cs.GR, cs.LG, eess.IV, stat.ML | コメントを受け付けていません

DCFormer: Efficient 3D Vision-Language Modeling with Decomposed Convolutions

投稿日: 2025年4月28日作成者: jarxiv

要約ビジョン言語モデル（VLM）は、視覚的表現とテキスト表現を整列させる能力に … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

LaRI: Layered Ray Intersections for Single-view 3D Geometric Reasoning

SpINR: Neural Volumetric Reconstruction for FMCW Radars

Nearly isotropic segmentation for medial temporal lobe subregions in multi-modality MRI

Understanding Depth and Height Perception in Large Visual-Language Models

Iterative Event-based Motion Segmentation by Variational Contrast Maximization

NoiseController: Towards Consistent Multi-view Video Generation via Noise Decomposition and Collaboration

Fast-Slow Thinking for Large Vision-Language Model Reasoning

RGS-DR: Reflective Gaussian Surfels with Deferred Rendering for Shiny Objects

Rethinking Few-Shot Image Fusion: Granular Ball Priors Enable General-Purpose Deep Fusion

DCFormer: Efficient 3D Vision-Language Modeling with Decomposed Convolutions

最近の投稿

最近のコメント

アーカイブ

カテゴリー