cs.CV」カテゴリーアーカイブ

RepVideo: Rethinking Cross-Layer Representation for Video Generation

要約 ビデオ生成は拡散モデルの導入により目覚ましい進歩を遂げ、生成されるビデオの … 続きを読む

カテゴリー: cs.CV | RepVideo: Rethinking Cross-Layer Representation for Video Generation はコメントを受け付けていません

A General Framework for Inference-time Scaling and Steering of Diffusion Models

要約 拡散モデルは、画像やビデオからタンパク質の設計やテキストに至るまで、さまざ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | A General Framework for Inference-time Scaling and Steering of Diffusion Models はコメントを受け付けていません

Click-Calib: A Robust Extrinsic Calibration Method for Surround-View Systems

要約 サラウンドビュー システム (SVS) は、先進運転支援システム (ADA … 続きを読む

カテゴリー: cs.CV | Click-Calib: A Robust Extrinsic Calibration Method for Surround-View Systems はコメントを受け付けていません

Vision Foundation Models for Computed Tomography

要約 財団モデル (FM) は、画像診断モダリティ全体で多様で複雑なタスクを実行 … 続きを読む

カテゴリー: cs.CV, eess.IV | Vision Foundation Models for Computed Tomography はコメントを受け付けていません

DeblurDiNAT: A Compact Model with Exceptional Generalization and Visual Fidelity on Unseen Domains

要約 最近のブレ除去ネットワークは、ぼやけた画像から鮮明な画像を効果的に復元しま … 続きを読む

カテゴリー: cs.CV | DeblurDiNAT: A Compact Model with Exceptional Generalization and Visual Fidelity on Unseen Domains はコメントを受け付けていません

SimGen: A Diffusion-Based Framework for Simultaneous Surgical Image and Segmentation Mask Generation

要約 外科データの取得と注釈付けは多くの場合、リソースを大量に消費し、倫理的な制 … 続きを読む

カテゴリー: cs.CV | SimGen: A Diffusion-Based Framework for Simultaneous Surgical Image and Segmentation Mask Generation はコメントを受け付けていません

Multimodal LLMs Can Reason about Aesthetics in Zero-Shot

要約 我々は、芸術作品の美しさを評価するためにマルチモーダルLLM(MLLM)の … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | Multimodal LLMs Can Reason about Aesthetics in Zero-Shot はコメントを受け付けていません

T2V-CompBench: A Comprehensive Benchmark for Compositional Text-to-video Generation

要約 Text-to-Video (T2V) 生成モデルは大幅に進歩しましたが、 … 続きを読む

カテゴリー: cs.CV | T2V-CompBench: A Comprehensive Benchmark for Compositional Text-to-video Generation はコメントを受け付けていません

Ouroboros-Diffusion: Exploring Consistent Content Generation in Tuning-free Long Video Diffusion

要約 事前トレーニングされたテキストからビデオへのモデルに基づいて構築された先入 … 続きを読む

カテゴリー: cs.CV | Ouroboros-Diffusion: Exploring Consistent Content Generation in Tuning-free Long Video Diffusion はコメントを受け付けていません

Testing Human-Hand Segmentation on In-Distribution and Out-of-Distribution Data in Human-Robot Interactions Using a Deep Ensemble Model

要約 人間の手の信頼性の高い検出とセグメント化は、安全性を強化し、人間とロボット … 続きを読む

カテゴリー: cs.CV, cs.HC, cs.LG, cs.RO | Testing Human-Hand Segmentation on In-Distribution and Out-of-Distribution Data in Human-Robot Interactions Using a Deep Ensemble Model はコメントを受け付けていません