cs.CV」カテゴリーアーカイブ

Improving Dynamic Object Interactions in Text-to-Video Generation with AI Feedback

要約 大規模なテキストからビデオへのモデルは、幅広い下流アプリケーションに計り知 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Improving Dynamic Object Interactions in Text-to-Video Generation with AI Feedback はコメントを受け付けていません

Continual Learning of Personalized Generative Face Models with Experience Replay

要約 つまり、異なる外見、スタイル、ポーズ、照明の新しい写真が定期的に撮影される … 続きを読む

カテゴリー: cs.CV | Continual Learning of Personalized Generative Face Models with Experience Replay はコメントを受け付けていません

Sharp-It: A Multi-view to Multi-view Diffusion Model for 3D Synthesis and Manipulation

要約 テキストから画像への拡散モデルの進歩により、3Dコンテンツの高速作成が大き … 続きを読む

カテゴリー: cs.CV, cs.LG | Sharp-It: A Multi-view to Multi-view Diffusion Model for 3D Synthesis and Manipulation はコメントを受け付けていません

Scaling Image Tokenizers with Grouped Spherical Quantization

要約 ビジョントークナイザーは、そのスケーラビリティとコンパクト性から多くの注目 … 続きを読む

カテゴリー: cs.AI, cs.CV | Scaling Image Tokenizers with Grouped Spherical Quantization はコメントを受け付けていません

MetaShadow: Object-Centered Shadow Detection, Removal, and Synthesis

要約 画像編集アプリケーションにおいて、影はしばしば十分に考慮されないか、無視さ … 続きを読む

カテゴリー: cs.CV | MetaShadow: Object-Centered Shadow Detection, Removal, and Synthesis はコメントを受け付けていません

Robust soybean seed yield estimation using high-throughput ground robot videos

要約 我々は、コンピュータビジョンとディープラーニング技術による高スループットな … 続きを読む

カテゴリー: cs.CV | Robust soybean seed yield estimation using high-throughput ground robot videos はコメントを受け付けていません

A Bidirectional Long Short Term Memory Approach for Infrastructure Health Monitoring Using On-board Vibration Response

要約 利用可能なインフラ監視データの量が増加しているため、直接計測を使用してイン … 続きを読む

カテゴリー: cs.CV | A Bidirectional Long Short Term Memory Approach for Infrastructure Health Monitoring Using On-board Vibration Response はコメントを受け付けていません

Decoupling Dark Knowledge via Block-wise Logit Distillation for Feature-level Alignment

要約 知識蒸留(Knowledge Distillation: KD)は、より大 … 続きを読む

カテゴリー: cs.CV, cs.LG | Decoupling Dark Knowledge via Block-wise Logit Distillation for Feature-level Alignment はコメントを受け付けていません

Go beyond End-to-End Training: Boosting Greedy Local Learning with Context Supply

要約 ディープネットワークの従来のE2E(end-to-end)学習では、バック … 続きを読む

カテゴリー: cs.CV, cs.LG, stat.ML | Go beyond End-to-End Training: Boosting Greedy Local Learning with Context Supply はコメントを受け付けていません

STRIDE: Single-video based Temporally Continuous Occlusion Robust 3D Pose Estimation

要約 人間の3Dポーズを正確に推定する能力は、行動認識、歩行認識、仮想現実/拡張 … 続きを読む

カテゴリー: cs.CV | STRIDE: Single-video based Temporally Continuous Occlusion Robust 3D Pose Estimation はコメントを受け付けていません