月別アーカイブ: 2023年6月

A Probabilistic Relaxation of the Two-Stage Object Pose Estimation Paradigm

要約 既存の物体の姿勢推定方法は一般に、1 対 1 の点マッチング ステップを必 … 続きを読む

カテゴリー: cs.CV, cs.RO | A Probabilistic Relaxation of the Two-Stage Object Pose Estimation Paradigm はコメントを受け付けていません

T2IAT: Measuring Valence and Stereotypical Biases in Text-to-Image Generation

要約 警告: この文書には、有毒、有害、または不快感を与える可能性のある内容がい … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, I.2.6 | T2IAT: Measuring Valence and Stereotypical Biases in Text-to-Image Generation はコメントを受け付けていません

MOSAIC: Masked Optimisation with Selective Attention for Image Reconstruction

要約 圧縮センシング (CS) は、スパース正則化逆問題を解くことにより、サブナ … 続きを読む

カテゴリー: cs.CV, eess.IV | MOSAIC: Masked Optimisation with Selective Attention for Image Reconstruction はコメントを受け付けていません

Conditioning Diffusion Models via Attributes and Semantic Masks for Face Generation

要約 深層生成モデルは、リアルな顔画像の生成において素晴らしい結果を示しています … 続きを読む

カテゴリー: cs.CV | Conditioning Diffusion Models via Attributes and Semantic Masks for Face Generation はコメントを受け付けていません

Instruct-NeRF2NeRF: Editing 3D Scenes with Instructions

要約 テキスト命令を使用して NeRF シーンを編集する方法を提案します。 シー … 続きを読む

カテゴリー: cs.CV, cs.GR | Instruct-NeRF2NeRF: Editing 3D Scenes with Instructions はコメントを受け付けていません

Vocabulary-free Image Classification

要約 大規模な視覚言語モデルの最近の進歩により、画像分類パラダイムに革命が起こり … 続きを読む

カテゴリー: cs.CV | Vocabulary-free Image Classification はコメントを受け付けていません

Sonicverse: A Multisensory Simulation Platform for Embodied Household Agents that See and Hear

要約 シミュレーションにおける身体化エージェントの開発は、近年の重要な研究テーマ … 続きを読む

カテゴリー: cs.CV, cs.HC, cs.RO | Sonicverse: A Multisensory Simulation Platform for Embodied Household Agents that See and Hear はコメントを受け付けていません

Inserting Anybody in Diffusion Models via Celeb Basis

要約 ユーザー自身のような革新的な概念を生成するために、事前学習済みの大規模なテ … 続きを読む

カテゴリー: cs.CV | Inserting Anybody in Diffusion Models via Celeb Basis はコメントを受け付けていません

Second Sight: Using brain-optimized encoding models to align image distributions with human brain activity

要約 最近の 2 つの開発により、人間の脳活動からの画像再構成の進歩が加速してい … 続きを読む

カテゴリー: cs.CV, cs.LG, q-bio.NC | Second Sight: Using brain-optimized encoding models to align image distributions with human brain activity はコメントを受け付けていません

D$^2$CSG: Unsupervised Learning of Compact CSG Trees with Dual Complements and Dropouts

要約 我々は、3D CAD 形状のコンパクト構成立体幾何学 (CSG) 表現の教 … 続きを読む

カテゴリー: cs.CV, cs.GR | D$^2$CSG: Unsupervised Learning of Compact CSG Trees with Dual Complements and Dropouts はコメントを受け付けていません