月別アーカイブ: 2024年2月

Convincing Rationales for Visual Question Answering Reasoning

要約 Visual Question Answering (VQA) は、画像の … 続きを読む

カテゴリー: cs.CV | Convincing Rationales for Visual Question Answering Reasoning はコメントを受け付けていません

Semantic2Graph: Graph-based Multi-modal Feature Fusion for Action Segmentation in Videos

要約 ビデオ アクション セグメンテーションは、多くの分野で広く適用されています … 続きを読む

カテゴリー: 68T01, 68T30, 68T45, cs.CV, cs.MM, I.2.10 | Semantic2Graph: Graph-based Multi-modal Feature Fusion for Action Segmentation in Videos はコメントを受け付けていません

Deep MSFOP: Multiple Spectral filter Operators Preservation in Deep Functional Maps for Unsupervised Shape Matching

要約 我々は、機能マップを計算するために、Multiple Spectral f … 続きを読む

カテゴリー: cs.CV | Deep MSFOP: Multiple Spectral filter Operators Preservation in Deep Functional Maps for Unsupervised Shape Matching はコメントを受け付けていません

EscherNet: A Generative Model for Scalable View Synthesis

要約 ビュー合成用のマルチビュー条件付き拡散モデルである EscherNet を … 続きを読む

カテゴリー: cs.CV | EscherNet: A Generative Model for Scalable View Synthesis はコメントを受け付けていません

Weakly Supervised 3D Object Detection with Multi-Stage Generalization

要約 大規模モデルの急速な開発に伴い、データの必要性がますます重要になっています … 続きを読む

カテゴリー: cs.CV | Weakly Supervised 3D Object Detection with Multi-Stage Generalization はコメントを受け付けていません

Elastic Feature Consolidation for Cold Start Exemplar-free Incremental Learning

要約 Exemplar-Free Class Incremental Learn … 続きを読む

カテゴリー: cs.CV, cs.LG | Elastic Feature Consolidation for Cold Start Exemplar-free Incremental Learning はコメントを受け付けていません

Bootstrapping Audio-Visual Segmentation by Strengthening Audio Cues

要約 オーディオと視覚を効果的に相互作用させる方法は、マルチモダリティ研究分野に … 続きを読む

カテゴリー: cs.CV | Bootstrapping Audio-Visual Segmentation by Strengthening Audio Cues はコメントを受け付けていません

SmoothVideo: Smooth Video Synthesis with Noise Constraints on Diffusion Models for One-shot Video Tuning

要約 最近のワンショット ビデオ調整方法は、事前トレーニングされたテキストから画 … 続きを読む

カテゴリー: cs.CV | SmoothVideo: Smooth Video Synthesis with Noise Constraints on Diffusion Models for One-shot Video Tuning はコメントを受け付けていません

One-Shot Action Recognition via Multi-Scale Spatial-Temporal Skeleton Matching

要約 単一のトレーニング サンプルでスケルトン アクション認識モデルを学習するこ … 続きを読む

カテゴリー: cs.AI, cs.CV | One-Shot Action Recognition via Multi-Scale Spatial-Temporal Skeleton Matching はコメントを受け付けていません

Diffusion Models, Image Super-Resolution And Everything: A Survey

要約 拡散モデル (DM) は、画像の超解像度 (SR) 分野を破壊し、画質と人 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | Diffusion Models, Image Super-Resolution And Everything: A Survey はコメントを受け付けていません