月別アーカイブ: 2024年9月

Point2Graph: An End-to-end Point Cloud-based 3D Open-Vocabulary Scene Graph for Robot Navigation

要約 現在のオープンボキャブラリーのシーングラフ生成アルゴリズムは、3D シーン … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Point2Graph: An End-to-end Point Cloud-based 3D Open-Vocabulary Scene Graph for Robot Navigation はコメントを受け付けていません

Taming Diffusion Models for Image Restoration: A Review

要約 拡散モデルは、生成モデリング、特に人間の好みに合わせて画質を向上させる点で … 続きを読む

カテゴリー: cs.CV | Taming Diffusion Models for Image Restoration: A Review はコメントを受け付けていません

2D or not 2D: How Does the Dimensionality of Gesture Representation Affect 3D Co-Speech Gesture Generation?

要約 共同スピーチのジェスチャーはコミュニケーションの基本です。 最近の深層学習 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG, cs.SD, eess.AS | 2D or not 2D: How Does the Dimensionality of Gesture Representation Affect 3D Co-Speech Gesture Generation? はコメントを受け付けていません

Frequency-Guided Masking for Enhanced Vision Self-Supervised Learning

要約 事前トレーニングの有効性を大幅に高める、新しい頻度ベースの自己教師あり学習 … 続きを読む

カテゴリー: cs.CV | Frequency-Guided Masking for Enhanced Vision Self-Supervised Learning はコメントを受け付けていません

Robust image representations with counterfactual contrastive learning

要約 対照的な事前トレーニングにより、モデルの一般化と下流のパフォーマンスを大幅 … 続きを読む

カテゴリー: cs.AI, cs.CV | Robust image representations with counterfactual contrastive learning はコメントを受け付けていません

Mamba-ST: State Space Model for Efficient Style Transfer

要約 スタイル転送の目的は、コンテンツ画像とスタイル ソースが与えられた場合、コ … 続きを読む

カテゴリー: cs.CV | Mamba-ST: State Space Model for Efficient Style Transfer はコメントを受け付けていません

Prompt-and-Transfer: Dynamic Class-aware Enhancement for Few-shot Segmentation

要約 目に見えないドメイン (クラス) をより効率的に一般化するために、ほとんど … 続きを読む

カテゴリー: cs.CV | Prompt-and-Transfer: Dynamic Class-aware Enhancement for Few-shot Segmentation はコメントを受け付けていません

PointViG: A Lightweight GNN-based Model for Efficient Point Cloud Analysis

要約 点群解析の分野では、複雑な 3D データセットの管理におけるグラフ ニュー … 続きを読む

カテゴリー: cs.CV | PointViG: A Lightweight GNN-based Model for Efficient Point Cloud Analysis はコメントを受け付けていません

Mitigate the Gap: Investigating Approaches for Improving Cross-Modal Alignment in CLIP

要約 Contrastive Language-Image Pre-traini … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Mitigate the Gap: Investigating Approaches for Improving Cross-Modal Alignment in CLIP はコメントを受け付けていません

Beyond Bare Queries: Open-Vocabulary Object Grounding with 3D Scene Graph

要約 自然言語で記述されたオブジェクトの位置を特定することは、自律エージェントに … 続きを読む

カテゴリー: cs.AI, cs.CV | Beyond Bare Queries: Open-Vocabulary Object Grounding with 3D Scene Graph はコメントを受け付けていません