投稿者「jarxiv」のアーカイブ

BTMTrack: Robust RGB-T Tracking via Dual-template Bridging and Temporal-Modal Candidate Elimination

要約 RGB-T トラッキングは、RGB と熱赤外線 (TIR) モダリティの相 … 続きを読む

カテゴリー: cs.CV | BTMTrack: Robust RGB-T Tracking via Dual-template Bridging and Temporal-Modal Candidate Elimination はコメントを受け付けていません

Comparison Study: Glacier Calving Front Delineation in Synthetic Aperture Radar Images With Deep Learning

要約 海洋終端氷河の前線位置の変化は、氷の質量損失の指標であり、数値氷河モデルに … 続きを読む

カテゴリー: cs.CV, cs.LG, I.4.6 | Comparison Study: Glacier Calving Front Delineation in Synthetic Aperture Radar Images With Deep Learning はコメントを受け付けていません

Geometry Restoration and Dewarping of Camera-Captured Document Images

要約 この研究は、検出、セグメンテーション、ジオメトリ復元、歪み補正のアルゴリズ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Geometry Restoration and Dewarping of Camera-Captured Document Images はコメントを受け付けていません

Less is More: The Influence of Pruning on the Explainability of CNNs

要約 コンピューター ビジョンにおける最新の畳み込みニューラル ネットワーク ( … 続きを読む

カテゴリー: cs.AI, cs.CV | Less is More: The Influence of Pruning on the Explainability of CNNs はコメントを受け付けていません

Voxel-Aggregated Feature Synthesis: Efficient Dense Mapping for Simulated 3D Reasoning

要約 私たちは、最近の最先端 (SOTA) オープンセット マルチモデル 3D … 続きを読む

カテゴリー: cs.CV | Voxel-Aggregated Feature Synthesis: Efficient Dense Mapping for Simulated 3D Reasoning はコメントを受け付けていません

JAQ: Joint Efficient Architecture Design and Low-Bit Quantization with Hardware-Software Co-Exploration

要約 ニューラル ネットワーク アーキテクチャ、量子化精度、およびハードウェア … 続きを読む

カテゴリー: cs.CV | JAQ: Joint Efficient Architecture Design and Low-Bit Quantization with Hardware-Software Co-Exploration はコメントを受け付けていません

GPT4Scene: Understand 3D Scenes from Videos with Vision-Language Models

要約 近年、2D Vision-Language Model (VLM) は、画 … 続きを読む

カテゴリー: cs.CV | GPT4Scene: Understand 3D Scenes from Videos with Vision-Language Models はコメントを受け付けていません

CROPS: Model-Agnostic Training-Free Framework for Safe Image Synthesis with Latent Diffusion Models

要約 拡散モデルの進歩により、画像生成のパフォーマンスが大幅に向上しました。 こ … 続きを読む

カテゴリー: cs.CV | CROPS: Model-Agnostic Training-Free Framework for Safe Image Synthesis with Latent Diffusion Models はコメントを受け付けていません

1-2-1: Renaissance of Single-Network Paradigm for Virtual Try-On

要約 仮想試着 (VTON) は、電子商取引において重要なツールとなっており、元 … 続きを読む

カテゴリー: cs.CV | 1-2-1: Renaissance of Single-Network Paradigm for Virtual Try-On はコメントを受け付けていません

Arc2Avatar: Generating Expressive 3D Avatars from a Single Image via ID Guidance

要約 マルチビュー設定内で詳細な 3D シーンを再構成する 3D ガウス スプラ … 続きを読む

カテゴリー: cs.CV | Arc2Avatar: Generating Expressive 3D Avatars from a Single Image via ID Guidance はコメントを受け付けていません