月別アーカイブ: 2023年3月

Scanning Only Once: An End-to-end Framework for Fast Temporal Grounding in Long Videos

要約 ビデオの一時的なグラウンディングは、クエリの説明に一致するビデオ セグメン … 続きを読む

カテゴリー: cs.CV | Scanning Only Once: An End-to-end Framework for Fast Temporal Grounding in Long Videos はコメントを受け付けていません

LargeKernel3D: Scaling up Kernels in 3D Sparse CNNs

要約 2D CNN の最近の進歩により、大きなカーネルが重要であることが明らかに … 続きを読む

カテゴリー: cs.CV, cs.LG | LargeKernel3D: Scaling up Kernels in 3D Sparse CNNs はコメントを受け付けていません

Sibling-Attack: Rethinking Transferable Adversarial Attacks against Face Recognition

要約 実用的な顔認識 (FR) 攻撃を開発する際の困難な課題は、ターゲット FR … 続きを読む

カテゴリー: cs.CV | Sibling-Attack: Rethinking Transferable Adversarial Attacks against Face Recognition はコメントを受け付けていません

Efficient Diffusion Training via Min-SNR Weighting Strategy

要約 拡散モデルのノイズ除去は、画像生成の主流のアプローチでしたが、これらのモデ … 続きを読む

カテゴリー: cs.CV | Efficient Diffusion Training via Min-SNR Weighting Strategy はコメントを受け付けていません

Enhancement of Novel View Synthesis Using Omnidirectional Image Completion

要約 この研究では、ニューラル放射輝度場 (NeRF) に基づいて単一の 360 … 続きを読む

カテゴリー: cs.CV | Enhancement of Novel View Synthesis Using Omnidirectional Image Completion はコメントを受け付けていません

AeDet: Azimuth-invariant Multi-view 3D Object Detection

要約 最近の LSS ベースのマルチビュー 3D オブジェクト検出は、畳み込み検 … 続きを読む

カテゴリー: cs.CV | AeDet: Azimuth-invariant Multi-view 3D Object Detection はコメントを受け付けていません

Pixel-wise Agricultural Image Time Series Classification: Comparisons and a Deformable Prototype-based Approach

要約 衛星による地球観測の改善により、これまで以上に高い時間的および空間的解像度 … 続きを読む

カテゴリー: cs.CV | Pixel-wise Agricultural Image Time Series Classification: Comparisons and a Deformable Prototype-based Approach はコメントを受け付けていません

Deployment of Image Analysis Algorithms under Prevalence Shifts

要約 ドメイン ギャップは、機械学習 (ML) ベースの医用画像解析ソリューショ … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Deployment of Image Analysis Algorithms under Prevalence Shifts はコメントを受け付けていません

Dynamic Relevance Learning for Few-Shot Object Detection

要約 高価な境界ボックスの注釈は、オブジェクト検出タスクの開発を制限しています。 … 続きを読む

カテゴリー: cs.CV, cs.LG | Dynamic Relevance Learning for Few-Shot Object Detection はコメントを受け付けていません

Q-HyViT: Post-Training Quantization for Hybrid Vision Transformer with Bridge Block Reconstruction

要約 最近、ビジョン トランスフォーマー (ViT) が、分類、検出、セグメンテ … 続きを読む

カテゴリー: cs.AI, cs.CV | Q-HyViT: Post-Training Quantization for Hybrid Vision Transformer with Bridge Block Reconstruction はコメントを受け付けていません