cs.CV」カテゴリーアーカイブ

UIFormer: A Unified Transformer-based Framework for Incremental Few-Shot Object Detection and Instance Segmentation

要約 このペーパーでは、Transformer アーキテクチャを使用した統合増分 … 続きを読む

カテゴリー: cs.CV | UIFormer: A Unified Transformer-based Framework for Incremental Few-Shot Object Detection and Instance Segmentation はコメントを受け付けていません

V-LoL: A Diagnostic Dataset for Visual Logical Learning

要約 ビジュアル AI の最近の開発は成功を収めていますが、さまざまな欠点が依然 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | V-LoL: A Diagnostic Dataset for Visual Logical Learning はコメントを受け付けていません

NavAgent: Multi-scale Urban Street View Fusion For UAV Embodied Vision-and-Language Navigation

要約 視覚と言語のナビゲーション (VLN) は、身体化されたインテリジェンスの … 続きを読む

カテゴリー: cs.CV, cs.RO | NavAgent: Multi-scale Urban Street View Fusion For UAV Embodied Vision-and-Language Navigation はコメントを受け付けていません

Slender Object Scene Segmentation in Remote Sensing Image Based on Learnable Morphological Skeleton with Segment Anything Model

要約 形態学的手法は、小さな構造の詳細を捕捉して保存する能力があるため、リモート … 続きを読む

カテゴリー: cs.CV | Slender Object Scene Segmentation in Remote Sensing Image Based on Learnable Morphological Skeleton with Segment Anything Model はコメントを受け付けていません

Generalized Pose Space Embeddings for Training In-the-Wild using Anaylis-by-Synthesis

要約 最新の姿勢推定モデルは、手動でラベル付けされた大規模なデータセットでトレー … 続きを読む

カテゴリー: cs.CV, cs.HC | Generalized Pose Space Embeddings for Training In-the-Wild using Anaylis-by-Synthesis はコメントを受け付けていません

LG-Gaze: Learning Geometry-aware Continuous Prompts for Language-Guided Gaze Estimation

要約 視線推定モデルの一般化能力は、特にトレーニング データセットが限られている … 続きを読む

カテゴリー: cs.CV | LG-Gaze: Learning Geometry-aware Continuous Prompts for Language-Guided Gaze Estimation はコメントを受け付けていません

Extracting polygonal footprints in off-nadir images with Segment Anything Model

要約 オフナディア航空画像からの建物フットプリント抽出 (BFE) には、屋根の … 続きを読む

カテゴリー: cs.CV | Extracting polygonal footprints in off-nadir images with Segment Anything Model はコメントを受け付けていません

Zero-shot capability of SAM-family models for bone segmentation in CT scans

要約 Segment Anything Model (SAM) および同様のモデ … 続きを読む

カテゴリー: cs.CV | Zero-shot capability of SAM-family models for bone segmentation in CT scans はコメントを受け付けていません

Optimal Transport on the Lie Group of Roto-translations

要約 ロトトランスレーション群 SE2 は、画像データをこのリー群で定義された多 … 続きを読む

カテゴリー: 62H35, 68T45, 68U10, 68U99, 90B06, cs.CV, math.DG, math.OC | Optimal Transport on the Lie Group of Roto-translations はコメントを受け付けていません

Towards More Accurate Fake Detection on Images Generated from Advanced Generative and Neural Rendering Models

要約 特にニューラル ラディアンス フィールドや 3D ガウス スプラッティング … 続きを読む

カテゴリー: cs.AI, cs.CV | Towards More Accurate Fake Detection on Images Generated from Advanced Generative and Neural Rendering Models はコメントを受け付けていません