cs.CV」カテゴリーアーカイブ

Efficient Few-Shot Continual Learning in Vision-Language Models

要約 Vision-Language Models(VLM)は、視覚的な質問応答 … 続きを読む

カテゴリー: cs.AI, cs.CV | Efficient Few-Shot Continual Learning in Vision-Language Models はコメントを受け付けていません

Harmonious Group Choreography with Trajectory-Controllable Diffusion

要約 音楽からグループの振り付けを作成することは、文化的なエンターテイメントと仮 … 続きを読む

カテゴリー: cs.CV | Harmonious Group Choreography with Trajectory-Controllable Diffusion はコメントを受け付けていません

SparseVLM: Visual Token Sparsification for Efficient Vision-Language Model Inference

要約 ビジョン言語モデル(VLMS)では、視覚トークンは通常、テキストトークンと … 続きを読む

カテゴリー: cs.CV | SparseVLM: Visual Token Sparsification for Efficient Vision-Language Model Inference はコメントを受け付けていません

KAN See In the Dark

要約 既存の低光画像強化方法は、不均一な照明と騒音効果のために、通常と低光の画像 … 続きを読む

カテゴリー: cs.AI, cs.CV | KAN See In the Dark はコメントを受け付けていません

Adaptive Margin Contrastive Learning for Ambiguity-aware 3D Semantic Segmentation

要約 この論文では、3Dポイントクラウドセマンティックセグメンテーション、つまり … 続きを読む

カテゴリー: cs.CV | Adaptive Margin Contrastive Learning for Ambiguity-aware 3D Semantic Segmentation はコメントを受け付けていません

Evaluating Numerical Reasoning in Text-to-Image Models

要約 テキストから画像への生成モデルは、自然言語を使用して記述されている概念を忠 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | Evaluating Numerical Reasoning in Text-to-Image Models はコメントを受け付けていません

Generative Adversarial Networks Bridging Art and Machine Intelligence

要約 この本は、GANの基本原則と歴史的発展の詳細な紹介から始まり、伝統的な生成 … 続きを読む

カテゴリー: cs.CV, cs.LG | Generative Adversarial Networks Bridging Art and Machine Intelligence はコメントを受け付けていません

MotionLab: Unified Human Motion Generation and Editing via the Motion-Condition-Motion Paradigm

要約 人間のモーション生成と編集は、コンピューターグラフィックとビジョンの重要な … 続きを読む

カテゴリー: cs.CV | MotionLab: Unified Human Motion Generation and Editing via the Motion-Condition-Motion Paradigm はコメントを受け付けていません

Beyond the Final Layer: Hierarchical Query Fusion Transformer with Agent-Interpolation Initialization for 3D Instance Segmentation

要約 3Dインスタンスセグメンテーションは、シーン内のオブジェクトインスタンスの … 続きを読む

カテゴリー: cs.CV | Beyond the Final Layer: Hierarchical Query Fusion Transformer with Agent-Interpolation Initialization for 3D Instance Segmentation はコメントを受け付けていません

HD-EPIC: A Highly-Detailed Egocentric Video Dataset

要約 新しく収集されたキッチンベースのエゴセントリックビデオの検証データセットを … 続きを読む

カテゴリー: cs.CV | HD-EPIC: A Highly-Detailed Egocentric Video Dataset はコメントを受け付けていません