cs.CV」カテゴリーアーカイブ

Imperceptible Protection against Style Imitation from Diffusion Models

要約 拡散モデルの最近の進歩により、画像生成の忠実度は大幅に向上しましたが、著作 … 続きを読む

カテゴリー: cs.CV | Imperceptible Protection against Style Imitation from Diffusion Models はコメントを受け付けていません

What is YOLOv8: An In-Depth Exploration of the Internal Features of the Next-Generation Object Detector

要約 この調査では、YOLOv8 オブジェクト検出モデルの詳細な分析を示し、その … 続きを読む

カテゴリー: cs.CV | What is YOLOv8: An In-Depth Exploration of the Internal Features of the Next-Generation Object Detector はコメントを受け付けていません

Provable Probabilistic Imaging using Score-Based Generative Priors

要約 高品質の画像を推定しなが​​らその不確実性を定量化することは、不正設定逆問 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Provable Probabilistic Imaging using Score-Based Generative Priors はコメントを受け付けていません

microYOLO: Towards Single-Shot Object Detection on Microcontrollers

要約 この進行中の論文では、YOLO を使用したマイクロコントローラーでのシング … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | microYOLO: Towards Single-Shot Object Detection on Microcontrollers はコメントを受け付けていません

GenDDS: Generating Diverse Driving Video Scenarios with Prompt-to-Video Generative Model

要約 自動運転トレーニングには、さまざまな交通状況、気象シナリオ、道路の種類を含 … 続きを読む

カテゴリー: cs.AI, cs.CV | GenDDS: Generating Diverse Driving Video Scenarios with Prompt-to-Video Generative Model はコメントを受け付けていません

Unleashing the Temporal-Spatial Reasoning Capacity of GPT for Training-Free Audio and Language Referenced Video Object Segmentation

要約 このペーパーでは、オーディオおよび言語参照ビデオ オブジェクト セグメンテ … 続きを読む

カテゴリー: cs.CV | Unleashing the Temporal-Spatial Reasoning Capacity of GPT for Training-Free Audio and Language Referenced Video Object Segmentation はコメントを受け付けていません

LLaVA-MoD: Making LLaVA Tiny via MoE Knowledge Distillation

要約 大規模な MLLM (l-MLLM) から知識を抽出することで、小規模なマ … 続きを読む

カテゴリー: cs.CV | LLaVA-MoD: Making LLaVA Tiny via MoE Knowledge Distillation はコメントを受け付けていません

SpineMamba: Enhancing 3D Spinal Segmentation in Clinical Imaging through Residual Visual Mamba Layers and Shape Priors

要約 3D 臨床医療画像の正確なセグメンテーションは、脊椎疾患の診断と治療におい … 続きを読む

カテゴリー: cs.CV, eess.IV | SpineMamba: Enhancing 3D Spinal Segmentation in Clinical Imaging through Residual Visual Mamba Layers and Shape Priors はコメントを受け付けていません

Disentangled Diffusion Autoencoder for Harmonization of Multi-site Neuroimaging Data

要約 複数の部位とスキャナーからの神経画像データセットを組み合わせると、統計的検 … 続きを読む

カテゴリー: cs.CV | Disentangled Diffusion Autoencoder for Harmonization of Multi-site Neuroimaging Data はコメントを受け付けていません

Gen-Swarms: Adapting Deep Generative Models to Swarms of Drones

要約 Gen-Swarms は、ディープ生成モデルの機能を活用し、リアクティブ … 続きを読む

カテゴリー: cs.CV, cs.RO | Gen-Swarms: Adapting Deep Generative Models to Swarms of Drones はコメントを受け付けていません