月別アーカイブ: 2023年7月

DORA: Exploring Outlier Representations in Deep Neural Networks

要約 ディープ ニューラル ネットワーク (DNN) は、内部表現内の複雑な抽象 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, stat.ML | DORA: Exploring Outlier Representations in Deep Neural Networks はコメントを受け付けていません

Joint Salient Object Detection and Camouflaged Object Detection via Uncertainty-aware Learning

要約 顕著な物体は人間の注意を引きつけ、通常は周囲からはっきりと目立ちます。 対 … 続きを読む

カテゴリー: cs.CV | Joint Salient Object Detection and Camouflaged Object Detection via Uncertainty-aware Learning はコメントを受け付けていません

Point Cloud Diffusion Models for Automatic Implant Generation

要約 生体適合性材料の 3D プリンティングの進歩により、患者固有のインプラント … 続きを読む

カテゴリー: cs.CV, eess.IV | Point Cloud Diffusion Models for Automatic Implant Generation はコメントを受け付けていません

FreeDrag: Point Tracking is Not You Need for Interactive Point-based Image Editing

要約 画像編集の複雑で多様な要求に応えるには、画像コンテンツの正確かつ柔軟な操作 … 続きを読む

カテゴリー: cs.CV, cs.HC, cs.LG | FreeDrag: Point Tracking is Not You Need for Interactive Point-based Image Editing はコメントを受け付けていません

Multimedia Generative Script Learning for Task Planning

要約 目標指向の生成スクリプト学習は、特定の目標に到達するための後続のステップを … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Multimedia Generative Script Learning for Task Planning はコメントを受け付けていません

CVPR MultiEarth 2023 Deforestation Estimation Challenge:SpaceVision4Amazon

要約 この論文では、電気光学 (EO) 衛星画像と合成開口レーダー (SAR) … 続きを読む

カテゴリー: cs.CV, eess.IV | CVPR MultiEarth 2023 Deforestation Estimation Challenge:SpaceVision4Amazon はコメントを受け付けていません

AnimateDiff: Animate Your Personalized Text-to-Image Diffusion Models without Specific Tuning

要約 テキストから画像へのモデル (安定拡散など) と、DreamBooth や … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.LG | AnimateDiff: Animate Your Personalized Text-to-Image Diffusion Models without Specific Tuning はコメントを受け付けていません

Divide, Evaluate, and Refine: Evaluating and Improving Text-to-Image Alignment with Iterative VQA Feedback

要約 テキスト条件付き画像生成の分野は、潜在拡散モデルの最近の出現により、比類の … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM, stat.ML | Divide, Evaluate, and Refine: Evaluating and Improving Text-to-Image Alignment with Iterative VQA Feedback はコメントを受け付けていません

Shelving, Stacking, Hanging: Relational Pose Diffusion for Multi-modal Rearrangement

要約 我々は、本棚の空いているスロットに本を挿入するなど、望ましいオブジェクトと … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Shelving, Stacking, Hanging: Relational Pose Diffusion for Multi-modal Rearrangement はコメントを受け付けていません

Learning Spatial Features from Audio-Visual Correspondence in Egocentric Videos

要約 私たちは、自己中心的なビデオにおける空間的な視聴覚対応に基づいて表現を学習 … 続きを読む

カテゴリー: cs.CV, cs.SD, eess.AS | Learning Spatial Features from Audio-Visual Correspondence in Egocentric Videos はコメントを受け付けていません