「cs.CV」カテゴリーアーカイブ

RepVideo: Rethinking Cross-Layer Representation for Video Generation

投稿日: 2025年1月16日作成者: jarxiv

要約ビデオ生成は拡散モデルの導入により目覚ましい進歩を遂げ、生成されるビデオの … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

A General Framework for Inference-time Scaling and Steering of Diffusion Models

投稿日: 2025年1月16日作成者: jarxiv

要約拡散モデルは、画像やビデオからタンパク質の設計やテキストに至るまで、さまざ … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Click-Calib: A Robust Extrinsic Calibration Method for Surround-View Systems

投稿日: 2025年1月16日作成者: jarxiv

要約サラウンドビューシステム (SVS) は、先進運転支援システム (ADA … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Vision Foundation Models for Computed Tomography

投稿日: 2025年1月16日作成者: jarxiv

要約財団モデル (FM) は、画像診断モダリティ全体で多様で複雑なタスクを実行 … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

DeblurDiNAT: A Compact Model with Exceptional Generalization and Visual Fidelity on Unseen Domains

投稿日: 2025年1月16日作成者: jarxiv

要約最近のブレ除去ネットワークは、ぼやけた画像から鮮明な画像を効果的に復元しま … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

SimGen: A Diffusion-Based Framework for Simultaneous Surgical Image and Segmentation Mask Generation

投稿日: 2025年1月16日作成者: jarxiv

要約外科データの取得と注釈付けは多くの場合、リソースを大量に消費し、倫理的な制 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Multimodal LLMs Can Reason about Aesthetics in Zero-Shot

投稿日: 2025年1月16日作成者: jarxiv

要約我々は、芸術作品の美しさを評価するためにマルチモーダルLLM（MLLM）の … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | コメントを受け付けていません

T2V-CompBench: A Comprehensive Benchmark for Compositional Text-to-video Generation

投稿日: 2025年1月16日作成者: jarxiv

要約 Text-to-Video (T2V) 生成モデルは大幅に進歩しましたが、 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Ouroboros-Diffusion: Exploring Consistent Content Generation in Tuning-free Long Video Diffusion

投稿日: 2025年1月16日作成者: jarxiv

要約事前トレーニングされたテキストからビデオへのモデルに基づいて構築された先入 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Testing Human-Hand Segmentation on In-Distribution and Out-of-Distribution Data in Human-Robot Interactions Using a Deep Ensemble Model

投稿日: 2025年1月15日作成者: jarxiv

要約人間の手の信頼性の高い検出とセグメント化は、安全性を強化し、人間とロボット … 続きを読む →

カテゴリー: cs.CV, cs.HC, cs.LG, cs.RO | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

RepVideo: Rethinking Cross-Layer Representation for Video Generation

A General Framework for Inference-time Scaling and Steering of Diffusion Models

Click-Calib: A Robust Extrinsic Calibration Method for Surround-View Systems

Vision Foundation Models for Computed Tomography

DeblurDiNAT: A Compact Model with Exceptional Generalization and Visual Fidelity on Unseen Domains

SimGen: A Diffusion-Based Framework for Simultaneous Surgical Image and Segmentation Mask Generation

Multimodal LLMs Can Reason about Aesthetics in Zero-Shot

T2V-CompBench: A Comprehensive Benchmark for Compositional Text-to-video Generation

Ouroboros-Diffusion: Exploring Consistent Content Generation in Tuning-free Long Video Diffusion

Testing Human-Hand Segmentation on In-Distribution and Out-of-Distribution Data in Human-Robot Interactions Using a Deep Ensemble Model

最近の投稿

最近のコメント

アーカイブ

カテゴリー