「cs.CV」カテゴリーアーカイブ

Harnessing Superclasses for Learning from Hierarchical Databases

投稿日: 2024年11月26日作成者: jarxiv

要約多くの大規模な分類問題では、クラスは既知の階層で編成され、通常はスーパーク … 続きを読む →

カテゴリー: cs.CV, stat.ML | コメントを受け付けていません

AnonyNoise: Anonymizing Event Data with Smart Noise to Outsmart Re-Identification and Preserve Privacy

投稿日: 2024年11月26日作成者: jarxiv

要約ディープニューラルネットワークの再識別機能の向上は、近年の公衆監視の強 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

SplatFlow: Multi-View Rectified Flow Model for 3D Gaussian Splatting Synthesis

投稿日: 2024年11月26日作成者: jarxiv

要約テキストベースの 3D シーンの生成と編集には、直感的なユーザーインタラ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

VQ-SGen: A Vector Quantized Stroke Representation for Sketch Generation

投稿日: 2024年11月26日作成者: jarxiv

要約本稿では、高品質なスケッチ生成のための新しいアルゴリズムである VQ-SG … 続きを読む →

カテゴリー: cs.CV, cs.GR | コメントを受け付けていません

VidComposition: Can MLLMs Analyze Compositions in Compiled Videos?

投稿日: 2024年11月26日作成者: jarxiv

要約マルチモーダル大規模言語モデル (MLLM) の進歩により、マルチモーダル … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

No Identity, no problem: Motion through detection for people tracking

投稿日: 2024年11月26日作成者: jarxiv

要約検出による追跡は、人物追跡の事実上の標準アプローチとなっています。堅牢性 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Efficient Video Face Enhancement with Enhanced Spatial-Temporal Consistency

投稿日: 2024年11月26日作成者: jarxiv

要約非常に一般的な種類のビデオとして、顔ビデオは映画、トークショー、生放送、 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Deformable Mamba for Wide Field of View Segmentation

投稿日: 2024年11月26日作成者: jarxiv

要約魚眼やパノラマ設定などの広視野カメラは、より広範囲の知覚に不可欠ですが、1 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Multi-Resolution Generative Modeling of Human Motion from Limited Data

投稿日: 2024年11月26日作成者: jarxiv

要約限られたトレーニングシーケンスから人間の動きを合成することを学習する生成 … 続きを読む →

カテゴリー: cs.CV, cs.GR, cs.LG, I.3 | コメントを受け付けていません

@Bench: Benchmarking Vision-Language Models for Human-centered Assistive Technology

投稿日: 2024年11月26日作成者: jarxiv

要約視覚言語モデル (VLM) が進歩するにつれて、視覚障害者 (PVI) を … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Harnessing Superclasses for Learning from Hierarchical Databases

AnonyNoise: Anonymizing Event Data with Smart Noise to Outsmart Re-Identification and Preserve Privacy

SplatFlow: Multi-View Rectified Flow Model for 3D Gaussian Splatting Synthesis

VQ-SGen: A Vector Quantized Stroke Representation for Sketch Generation

VidComposition: Can MLLMs Analyze Compositions in Compiled Videos?

No Identity, no problem: Motion through detection for people tracking

Efficient Video Face Enhancement with Enhanced Spatial-Temporal Consistency

Deformable Mamba for Wide Field of View Segmentation

Multi-Resolution Generative Modeling of Human Motion from Limited Data

@Bench: Benchmarking Vision-Language Models for Human-centered Assistive Technology

最近の投稿

最近のコメント

アーカイブ

カテゴリー