月別アーカイブ: 2023年5月

Towards minimizing efforts for Morphing Attacks — Deep embeddings for morphing pair selection and improved Morphing Attack Detection

要約 顔モーフィング攻撃は、関与する両方の個人が同じ文書を悪用できるため、特にそ … 続きを読む

カテゴリー: cs.CV | Towards minimizing efforts for Morphing Attacks — Deep embeddings for morphing pair selection and improved Morphing Attack Detection はコメントを受け付けていません

GazeGNN: A Gaze-Guided Graph Neural Network for Disease Classification

要約 近年、医用画像解析における視線追跡技術の応用がますます一般的になってきてい … 続きを読む

カテゴリー: cs.CV | GazeGNN: A Gaze-Guided Graph Neural Network for Disease Classification はコメントを受け付けていません

TaleCrafter: Interactive Story Visualization with Multiple Characters

要約 ストーリーを正確に視覚化するには、フレーム間の同一性の一貫性、プレーン テ … 続きを読む

カテゴリー: cs.CV | TaleCrafter: Interactive Story Visualization with Multiple Characters はコメントを受け付けていません

GlyphControl: Glyph Conditional Control for Visual Text Generation

要約 最近、一貫性のある整形式のビジュアル テキストを生成できる、拡散ベースのテ … 続きを読む

カテゴリー: cs.CV | GlyphControl: Glyph Conditional Control for Visual Text Generation はコメントを受け付けていません

Synfeal: A Data-Driven Simulator for End-to-End Camera Localization

要約 現実世界のデータの収集は、人工知能のボトルネックであると考えられており、い … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Synfeal: A Data-Driven Simulator for End-to-End Camera Localization はコメントを受け付けていません

Gen-L-Video: Multi-Text to Long Video Generation via Temporal Co-Denoising

要約 大規模な画像とテキストのデータセットと拡散モデルの進歩を活用して、テキスト … 続きを読む

カテゴリー: cs.CV | Gen-L-Video: Multi-Text to Long Video Generation via Temporal Co-Denoising はコメントを受け付けていません

Pix2Repair: Implicit Shape Restoration from Images

要約 壊れたオブジェクトを修復するために画像から修復形状を生成する自動形状修復ア … 続きを読む

カテゴリー: cs.CV | Pix2Repair: Implicit Shape Restoration from Images はコメントを受け付けていません

Reconstructing the Mind’s Eye: fMRI-to-Image with Contrastive Learning and Diffusion Priors

要約 我々は、脳活動から観察された画像を取得して再構成するための新しい fMRI … 続きを読む

カテゴリー: cs.AI, cs.CV, q-bio.NC | Reconstructing the Mind’s Eye: fMRI-to-Image with Contrastive Learning and Diffusion Priors はコメントを受け付けていません

3DTeethSeg’22: 3D Teeth Scan Segmentation and Labeling Challenge

要約 口腔内 3D スキャンからの歯の位置特定、セグメンテーション、およびラベル … 続きを読む

カテゴリー: cs.AI, cs.CV | 3DTeethSeg’22: 3D Teeth Scan Segmentation and Labeling Challenge はコメントを受け付けていません

Contextual Object Detection with Multimodal Large Language Models

要約 最近のマルチモーダル大規模言語モデル (MLLM) は、画像キャプションや … 続きを読む

カテゴリー: cs.AI, cs.CV | Contextual Object Detection with Multimodal Large Language Models はコメントを受け付けていません