cs.CV」カテゴリーアーカイブ

Iterating the Transient Light Transport Matrix for Non-Line-of-Sight Imaging

要約 アクティブ イメージング システムは、制御可能な光源を使用してシーン内のさ … 続きを読む

カテゴリー: cs.CV, physics.optics | Iterating the Transient Light Transport Matrix for Non-Line-of-Sight Imaging はコメントを受け付けていません

DeepSeek-VL2: Mixture-of-Experts Vision-Language Models for Advanced Multimodal Understanding

要約 ここでは、大規模な専門家混合 (MoE) ビジョン言語モデルの高度なシリー … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | DeepSeek-VL2: Mixture-of-Experts Vision-Language Models for Advanced Multimodal Understanding はコメントを受け付けていません

TrafficLoc: Localizing Traffic Surveillance Cameras in 3D Scenes

要約 私たちは、協力的な知覚において交通監視カメラの位置を特定するという問題に取 … 続きを読む

カテゴリー: cs.CV | TrafficLoc: Localizing Traffic Surveillance Cameras in 3D Scenes はコメントを受け付けていません

BrushEdit: All-In-One Image Inpainting and Editing

要約 画像編集は、反転ベースの方法と命令ベースの方法の両方を使用した拡散モデルの … 続きを読む

カテゴリー: cs.AI, cs.CV | BrushEdit: All-In-One Image Inpainting and Editing はコメントを受け付けていません

XYScanNet: An Interpretable State Space Model for Perceptual Image Deblurring

要約 最近の Mamba アーキテクチャと同様に、深層状態空間モデル (SSM) … 続きを読む

カテゴリー: cs.CV | XYScanNet: An Interpretable State Space Model for Perceptual Image Deblurring はコメントを受け付けていません

A Universal Degradation-based Bridging Technique for Domain Adaptive Semantic Segmentation

要約 セマンティック セグメンテーションは、トレーニングされたネットワークが別の … 続きを読む

カテゴリー: cs.CV | A Universal Degradation-based Bridging Technique for Domain Adaptive Semantic Segmentation はコメントを受け付けていません

Iris: Breaking GUI Complexity with Adaptive Focus and Self-Refining

要約 Web ページ、ソフトウェア アプリケーション、オペレーティング システム … 続きを読む

カテゴリー: cs.AI, cs.CV | Iris: Breaking GUI Complexity with Adaptive Focus and Self-Refining はコメントを受け付けていません

A dual contrastive framework

要約 現在のマルチモーダル タスクでは、モデルは通常、領域キャプションなどのタス … 続きを読む

カテゴリー: cs.AI, cs.CV | A dual contrastive framework はコメントを受け付けていません

Ensuring Force Safety in Vision-Guided Robotic Manipulation via Implicit Tactile Calibration

要約 動的な環境では、ロボットがドアなどの特定のプロパティを持つオブジェクトを操 … 続きを読む

カテゴリー: cs.CV, cs.RO | Ensuring Force Safety in Vision-Guided Robotic Manipulation via Implicit Tactile Calibration はコメントを受け付けていません

VibrantVS: A high-resolution multi-task transformer for forest canopy height estimation

要約 この論文では、米国西部全域の 4 バンド国立農業画像プログラム (NAIP … 続きを読む

カテゴリー: cs.CV, I.2.10 | VibrantVS: A high-resolution multi-task transformer for forest canopy height estimation はコメントを受け付けていません