cs.CV」カテゴリーアーカイブ

Harnessing Superclasses for Learning from Hierarchical Databases

要約 多くの大規模な分類問題では、クラスは既知の階層で編成され、通常はスーパーク … 続きを読む

カテゴリー: cs.CV, stat.ML | Harnessing Superclasses for Learning from Hierarchical Databases はコメントを受け付けていません

AnonyNoise: Anonymizing Event Data with Smart Noise to Outsmart Re-Identification and Preserve Privacy

要約 ディープ ニューラル ネットワークの再識別機能の向上は、近年の公衆監視の強 … 続きを読む

カテゴリー: cs.CV | AnonyNoise: Anonymizing Event Data with Smart Noise to Outsmart Re-Identification and Preserve Privacy はコメントを受け付けていません

SplatFlow: Multi-View Rectified Flow Model for 3D Gaussian Splatting Synthesis

要約 テキストベースの 3D シーンの生成と編集には、直感的なユーザー インタラ … 続きを読む

カテゴリー: cs.CV | SplatFlow: Multi-View Rectified Flow Model for 3D Gaussian Splatting Synthesis はコメントを受け付けていません

VQ-SGen: A Vector Quantized Stroke Representation for Sketch Generation

要約 本稿では、高品質なスケッチ生成のための新しいアルゴリズムである VQ-SG … 続きを読む

カテゴリー: cs.CV, cs.GR | VQ-SGen: A Vector Quantized Stroke Representation for Sketch Generation はコメントを受け付けていません

VidComposition: Can MLLMs Analyze Compositions in Compiled Videos?

要約 マルチモーダル大規模言語モデル (MLLM) の進歩により、マルチモーダル … 続きを読む

カテゴリー: cs.AI, cs.CV | VidComposition: Can MLLMs Analyze Compositions in Compiled Videos? はコメントを受け付けていません

No Identity, no problem: Motion through detection for people tracking

要約 検出による追跡は、人物追跡の事実上の標準アプローチとなっています。 堅牢性 … 続きを読む

カテゴリー: cs.CV, cs.LG | No Identity, no problem: Motion through detection for people tracking はコメントを受け付けていません

Efficient Video Face Enhancement with Enhanced Spatial-Temporal Consistency

要約 非常に一般的な種類のビデオとして、顔ビデオは映画、トーク ショー、生放送、 … 続きを読む

カテゴリー: cs.CV | Efficient Video Face Enhancement with Enhanced Spatial-Temporal Consistency はコメントを受け付けていません

Deformable Mamba for Wide Field of View Segmentation

要約 魚眼やパノラマ設定などの広視野カメラは、より広範囲の知覚に不可欠ですが、1 … 続きを読む

カテゴリー: cs.CV | Deformable Mamba for Wide Field of View Segmentation はコメントを受け付けていません

Multi-Resolution Generative Modeling of Human Motion from Limited Data

要約 限られたトレーニング シーケンスから人間の動きを合成することを学習する生成 … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.LG, I.3 | Multi-Resolution Generative Modeling of Human Motion from Limited Data はコメントを受け付けていません

@Bench: Benchmarking Vision-Language Models for Human-centered Assistive Technology

要約 視覚言語モデル (VLM) が進歩するにつれて、視覚障害者 (PVI) を … 続きを読む

カテゴリー: cs.CV | @Bench: Benchmarking Vision-Language Models for Human-centered Assistive Technology はコメントを受け付けていません