cs.CV」カテゴリーアーカイブ

MicroDreamer: Efficient 3D Generation in $\sim$20 Seconds by Score-based Iterative Reconstruction

要約 スコア蒸留サンプリング (SDS) などの最適化ベースのアプローチは、ゼロ … 続きを読む

カテゴリー: cs.CV | MicroDreamer: Efficient 3D Generation in $\sim$20 Seconds by Score-based Iterative Reconstruction はコメントを受け付けていません

LUDVIG: Learning-free Uplifting of 2D Visual features to Gaussian Splatting scenes

要約 私たちは、視覚的特徴やセマンティック マスクを 2D ビジョン モデルから … 続きを読む

カテゴリー: cs.CV | LUDVIG: Learning-free Uplifting of 2D Visual features to Gaussian Splatting scenes はコメントを受け付けていません

Quantization Effects on Neural Networks Perception: How would quantization change the perceptual field of vision models?

要約 ニューラル ネットワークの量子化は、リソースが限られたデバイスにモデルを展 … 続きを読む

カテゴリー: cs.CV | Quantization Effects on Neural Networks Perception: How would quantization change the perceptual field of vision models? はコメントを受け付けていません

How Do Training Methods Influence the Utilization of Vision Models?

要約 すべての学習可能なパラメータ (重みなど) がニューラル ネットワークの決 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | How Do Training Methods Influence the Utilization of Vision Models? はコメントを受け付けていません

An Integrated Deep Learning Model for Skin Cancer Detection Using Hybrid Feature Fusion Technique

要約 皮膚がんは、DNA 損傷によって引き起こされる重篤で死に至る可能性のある病 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | An Integrated Deep Learning Model for Skin Cancer Detection Using Hybrid Feature Fusion Technique はコメントを受け付けていません

Neural Real-Time Recalibration for Infrared Multi-Camera Systems

要約 現在、赤外線マルチカメラ システムのリアルタイム再キャリブレーションのため … 続きを読む

カテゴリー: cs.CV, cs.GR | Neural Real-Time Recalibration for Infrared Multi-Camera Systems はコメントを受け付けていません

Deep Implicit Optimization for Robust and Flexible Image Registration

要約 画像レジストレーションにおける深層学習 (DLIR) 手法は、その速度とト … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Deep Implicit Optimization for Robust and Flexible Image Registration はコメントを受け付けていません

On Efficient Variants of Segment Anything Model: A Survey

要約 Segment Anything Model (SAM) は、画像セグメン … 続きを読む

カテゴリー: cs.CV | On Efficient Variants of Segment Anything Model: A Survey はコメントを受け付けていません

LEAD: Latent Realignment for Human Motion Diffusion

要約 私たちの目標は、自然言語からリアルな人間の動きを生成することです。 最新の … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | LEAD: Latent Realignment for Human Motion Diffusion はコメントを受け付けていません

CLIP-VAD: Exploiting Vision-Language Models for Voice Activity Detection

要約 音声アクティビティ検出 (VAD) は、人が話しているかどうかを自動的に判 … 続きを読む

カテゴリー: cs.CV | CLIP-VAD: Exploiting Vision-Language Models for Voice Activity Detection はコメントを受け付けていません