cs.CV」カテゴリーアーカイブ

3D Reconstruction of non-visible surfaces of objects from a Single Depth View — Comparative Study

要約 シーンとオブジェクトの再構築は、特に衝突のない軌跡を計画したり、オブジェク … 続きを読む

カテゴリー: cs.CV, cs.RO | 3D Reconstruction of non-visible surfaces of objects from a Single Depth View — Comparative Study はコメントを受け付けていません

3DGS$^2$: Near Second-order Converging 3D Gaussian Splatting

要約 3Dガウススプラッティング(3DG)は、新しいビュー合成と3D再建のための … 続きを読む

カテゴリー: cs.CV, cs.GR | 3DGS$^2$: Near Second-order Converging 3D Gaussian Splatting はコメントを受け付けていません

Toward Efficient Generalization in 3D Human Pose Estimation via a Canonical Domain Approach

要約 深い学習方法の最近の進歩により、3Dヒトポーズ推定(HPE)のパフォーマン … 続きを読む

カテゴリー: cs.AI, cs.CV | Toward Efficient Generalization in 3D Human Pose Estimation via a Canonical Domain Approach はコメントを受け付けていません

Efficient Portrait Matte Creation With Layer Diffusion and Connectivity Priors

要約 効果的な深いポートレートマットモデルを学習するには、高品質と大量の両方のト … 続きを読む

カテゴリー: cs.CV | Efficient Portrait Matte Creation With Layer Diffusion and Connectivity Priors はコメントを受け付けていません

Learning Point Spread Function Invertibility Assessment for Image Deconvolution

要約 Deep-Learning(DL)ベースの画像デコンボリューション(ID) … 続きを読む

カテゴリー: 68T10, 94A08, cs.CV, eess.IV, I.4.5 | Learning Point Spread Function Invertibility Assessment for Image Deconvolution はコメントを受け付けていません

VCRScore: Image captioning metric based on V\&L Transformers, CLIP, and precision-recall

要約 画像キャプションは、本質的なビジョンと言語研究のタスクになっています。 特 … 続きを読む

カテゴリー: 68Txx, cs.CL, cs.CV, I.4 | VCRScore: Image captioning metric based on V\&L Transformers, CLIP, and precision-recall はコメントを受け付けていません

BAG: Body-Aligned 3D Wearable Asset Generation

要約 最近の進歩により、一般的な3D形状生成モデルで顕著な進歩が示されていますが … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | BAG: Body-Aligned 3D Wearable Asset Generation はコメントを受け付けていません

Text-driven Adaptation of Foundation Models for Few-shot Surgical Workflow Analysis

要約 目的:外科的ワークフロー分析は、外科的効率と安全性を改善するために重要です … 続きを読む

カテゴリー: cs.AI, cs.CV | Text-driven Adaptation of Foundation Models for Few-shot Surgical Workflow Analysis はコメントを受け付けていません

The Linear Attention Resurrection in Vision Transformer

要約 Vision Transformers(VITS)は最近、コンピュータービ … 続きを読む

カテゴリー: cs.AI, cs.CV | The Linear Attention Resurrection in Vision Transformer はコメントを受け付けていません

MoColl: Agent-Based Specific and General Model Collaboration for Image Captioning

要約 画像キャプションは、コンピュータービジョンと自然言語処理の交差点における重 … 続きを読む

カテゴリー: cs.AI, cs.CV | MoColl: Agent-Based Specific and General Model Collaboration for Image Captioning はコメントを受け付けていません