月別アーカイブ: 2023年3月

Scanning Only Once: An End-to-end Framework for Fast Temporal Grounding in Long Videos

投稿日: 2023年3月23日作成者: jarxiv

要約ビデオの一時的なグラウンディングは、クエリの説明に一致するビデオセグメン … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

LargeKernel3D: Scaling up Kernels in 3D Sparse CNNs

投稿日: 2023年3月23日作成者: jarxiv

要約 2D CNN の最近の進歩により、大きなカーネルが重要であることが明らかに … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Sibling-Attack: Rethinking Transferable Adversarial Attacks against Face Recognition

投稿日: 2023年3月23日作成者: jarxiv

要約実用的な顔認識 (FR) 攻撃を開発する際の困難な課題は、ターゲット FR … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Efficient Diffusion Training via Min-SNR Weighting Strategy

投稿日: 2023年3月23日作成者: jarxiv

要約拡散モデルのノイズ除去は、画像生成の主流のアプローチでしたが、これらのモデ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Enhancement of Novel View Synthesis Using Omnidirectional Image Completion

投稿日: 2023年3月23日作成者: jarxiv

要約この研究では、ニューラル放射輝度場 (NeRF) に基づいて単一の 360 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

AeDet: Azimuth-invariant Multi-view 3D Object Detection

投稿日: 2023年3月23日作成者: jarxiv

要約最近の LSS ベースのマルチビュー 3D オブジェクト検出は、畳み込み検 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Pixel-wise Agricultural Image Time Series Classification: Comparisons and a Deformable Prototype-based Approach

投稿日: 2023年3月23日作成者: jarxiv

要約衛星による地球観測の改善により、これまで以上に高い時間的および空間的解像度 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Deployment of Image Analysis Algorithms under Prevalence Shifts

投稿日: 2023年3月23日作成者: jarxiv

要約ドメインギャップは、機械学習 (ML) ベースの医用画像解析ソリューショ … 続きを読む →

カテゴリー: cs.CV, cs.LG, eess.IV | コメントを受け付けていません

Dynamic Relevance Learning for Few-Shot Object Detection

投稿日: 2023年3月23日作成者: jarxiv

要約高価な境界ボックスの注釈は、オブジェクト検出タスクの開発を制限しています。 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Q-HyViT: Post-Training Quantization for Hybrid Vision Transformer with Bridge Block Reconstruction

投稿日: 2023年3月23日作成者: jarxiv

要約最近、ビジョントランスフォーマー (ViT) が、分類、検出、セグメンテ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

月別アーカイブ: 2023年3月

Scanning Only Once: An End-to-end Framework for Fast Temporal Grounding in Long Videos

LargeKernel3D: Scaling up Kernels in 3D Sparse CNNs

Sibling-Attack: Rethinking Transferable Adversarial Attacks against Face Recognition

Efficient Diffusion Training via Min-SNR Weighting Strategy

Enhancement of Novel View Synthesis Using Omnidirectional Image Completion

AeDet: Azimuth-invariant Multi-view 3D Object Detection

Pixel-wise Agricultural Image Time Series Classification: Comparisons and a Deformable Prototype-based Approach

Deployment of Image Analysis Algorithms under Prevalence Shifts

Dynamic Relevance Learning for Few-Shot Object Detection

Q-HyViT: Post-Training Quantization for Hybrid Vision Transformer with Bridge Block Reconstruction

最近の投稿

最近のコメント

アーカイブ

カテゴリー