cs.CV」カテゴリーアーカイブ

AV-Odyssey Bench: Can Your Multimodal LLMs Really Understand Audio-Visual Information?

要約 近年、GPT-4o、Gemini 1.5 Pro、Reka Coreなどの … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM, cs.SD, eess.AS | コメントする

Improving Dynamic Object Interactions in Text-to-Video Generation with AI Feedback

要約 大規模なテキストからビデオへのモデルは、幅広い下流アプリケーションに計り知 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | コメントする

Continual Learning of Personalized Generative Face Models with Experience Replay

要約 つまり、異なる外見、スタイル、ポーズ、照明の新しい写真が定期的に撮影される … 続きを読む

カテゴリー: cs.CV | コメントする

Sharp-It: A Multi-view to Multi-view Diffusion Model for 3D Synthesis and Manipulation

要約 テキストから画像への拡散モデルの進歩により、3Dコンテンツの高速作成が大き … 続きを読む

カテゴリー: cs.CV, cs.LG | コメントする

Scaling Image Tokenizers with Grouped Spherical Quantization

要約 ビジョントークナイザーは、そのスケーラビリティとコンパクト性から多くの注目 … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

MetaShadow: Object-Centered Shadow Detection, Removal, and Synthesis

要約 画像編集アプリケーションにおいて、影はしばしば十分に考慮されないか、無視さ … 続きを読む

カテゴリー: cs.CV | コメントする

Robust soybean seed yield estimation using high-throughput ground robot videos

要約 我々は、コンピュータビジョンとディープラーニング技術による高スループットな … 続きを読む

カテゴリー: cs.CV | コメントする

A Bidirectional Long Short Term Memory Approach for Infrastructure Health Monitoring Using On-board Vibration Response

要約 利用可能なインフラ監視データの量が増加しているため、直接計測を使用してイン … 続きを読む

カテゴリー: cs.CV | コメントする

Decoupling Dark Knowledge via Block-wise Logit Distillation for Feature-level Alignment

要約 知識蒸留(Knowledge Distillation: KD)は、より大 … 続きを読む

カテゴリー: cs.CV, cs.LG | コメントする

Go beyond End-to-End Training: Boosting Greedy Local Learning with Context Supply

要約 ディープネットワークの従来のE2E(end-to-end)学習では、バック … 続きを読む

カテゴリー: cs.CV, cs.LG, stat.ML | コメントする