cs.CV」カテゴリーアーカイブ

Invertible Consistency Distillation for Text-Guided Image Editing in Around 7 Steps

要約 拡散蒸留は、少数のサンプリング ステップで忠実なテキストから画像への生成を … 続きを読む

カテゴリー: cs.CV | Invertible Consistency Distillation for Text-Guided Image Editing in Around 7 Steps はコメントを受け付けていません

Structure-Aware Human Body Reshaping with Adaptive Affinity-Graph Network

要約 ソースポートレートが与えられると、自動人体再整形タスクは、それを美しい体型 … 続きを読む

カテゴリー: cs.CV | Structure-Aware Human Body Reshaping with Adaptive Affinity-Graph Network はコメントを受け付けていません

DGNN-YOLO: Dynamic Graph Neural Networks with YOLO11 for Small Object Detection and Tracking in Traffic Surveillance

要約 歩行者、自転車、バイクなどの小さな物体の正確な検出と追跡は、交通監視システ … 続きを読む

カテゴリー: cs.CV, cs.LG | DGNN-YOLO: Dynamic Graph Neural Networks with YOLO11 for Small Object Detection and Tracking in Traffic Surveillance はコメントを受け付けていません

PartGS:Learning Part-aware 3D Representations by Fusing 2D Gaussians and Superquadrics

要約 点群、メッシュ、NeRF、3D ガウスなどの低レベルの 3D 表現は、3D … 続きを読む

カテゴリー: cs.CV | PartGS:Learning Part-aware 3D Representations by Fusing 2D Gaussians and Superquadrics はコメントを受け付けていません

Learning Temporally Consistent Video Depth from Video Diffusion Priors

要約 この研究では、フレームごとの精度だけでなく、より重要なことに、フレーム間の … 続きを読む

カテゴリー: cs.CV | Learning Temporally Consistent Video Depth from Video Diffusion Priors はコメントを受け付けていません

ConvMixFormer- A Resource-efficient Convolution Mixer for Transformer-based Dynamic Hand Gesture Recognition

要約 Transformer モデルは、自然言語処理 (NLP) やコンピュータ … 続きを読む

カテゴリー: cs.CV, cs.HC, cs.LG | ConvMixFormer- A Resource-efficient Convolution Mixer for Transformer-based Dynamic Hand Gesture Recognition はコメントを受け付けていません

OminiControl: Minimal and Universal Control for Diffusion Transformer

要約 このペーパーでは、画像条件を事前トレーニング済みの拡散変換 (DiT) モ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | OminiControl: Minimal and Universal Control for Diffusion Transformer はコメントを受け付けていません

Understanding Generalizability of Diffusion Models Requires Rethinking the Hidden Gaussian Structure

要約 この研究では、学習されたスコア関数の隠れた特性を調べることによって拡散モデ … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV, eess.SP | Understanding Generalizability of Diffusion Models Requires Rethinking the Hidden Gaussian Structure はコメントを受け付けていません

Moner: Motion Correction in Undersampled Radial MRI with Unsupervised Neural Representation

要約 ラジアル MRI における動き補正 (MoCo) は、被験者の動きが予測で … 続きを読む

カテゴリー: cs.CV, eess.IV | Moner: Motion Correction in Undersampled Radial MRI with Unsupervised Neural Representation はコメントを受け付けていません

GuardSplat: Efficient and Robust Watermarking for 3D Gaussian Splatting

要約 3D ガウス スプラッティング (3DGS) は最近、さまざまなアプリケー … 続きを読む

カテゴリー: cs.CR, cs.CV | GuardSplat: Efficient and Robust Watermarking for 3D Gaussian Splatting はコメントを受け付けていません