-
最近の投稿
- Cooptimizing Safety and Performance with a Control-Constrained Formulation
- Adapting Pre-Trained Vision Models for Novel Instance Detection and Segmentation
- Reactive Synthesis of Sensor Revealing Strategies in Hypergames on Graphs
- Tractability Frontiers in Multi-Robot Coordination and Geometric Reconfiguration
- C*: A New Bounding Approach for the Moving-Target Traveling Salesman Problem
-
最近のコメント
表示できるコメントはありません。 cs.AI (30452) cs.CL (23010) cs.CR (2370) cs.CV (36826) cs.LG (35319) cs.RO (17734) cs.SY (2729) eess.IV (4472) eess.SY (2723) stat.ML (4702)
「cs.CV」カテゴリーアーカイブ
AV-Odyssey Bench: Can Your Multimodal LLMs Really Understand Audio-Visual Information?
要約 近年、GPT-4o、Gemini 1.5 Pro、Reka Coreなどの … 続きを読む
Improving Dynamic Object Interactions in Text-to-Video Generation with AI Feedback
要約 大規模なテキストからビデオへのモデルは、幅広い下流アプリケーションに計り知 … 続きを読む
Continual Learning of Personalized Generative Face Models with Experience Replay
要約 つまり、異なる外見、スタイル、ポーズ、照明の新しい写真が定期的に撮影される … 続きを読む
Sharp-It: A Multi-view to Multi-view Diffusion Model for 3D Synthesis and Manipulation
要約 テキストから画像への拡散モデルの進歩により、3Dコンテンツの高速作成が大き … 続きを読む
Scaling Image Tokenizers with Grouped Spherical Quantization
要約 ビジョントークナイザーは、そのスケーラビリティとコンパクト性から多くの注目 … 続きを読む
MetaShadow: Object-Centered Shadow Detection, Removal, and Synthesis
要約 画像編集アプリケーションにおいて、影はしばしば十分に考慮されないか、無視さ … 続きを読む
Robust soybean seed yield estimation using high-throughput ground robot videos
要約 我々は、コンピュータビジョンとディープラーニング技術による高スループットな … 続きを読む
A Bidirectional Long Short Term Memory Approach for Infrastructure Health Monitoring Using On-board Vibration Response
要約 利用可能なインフラ監視データの量が増加しているため、直接計測を使用してイン … 続きを読む
Decoupling Dark Knowledge via Block-wise Logit Distillation for Feature-level Alignment
要約 知識蒸留(Knowledge Distillation: KD)は、より大 … 続きを読む