月別アーカイブ: 2025年3月

Tiled Diffusion

要約 画像タイル – 一貫した視野を作成するための異なる画像のシーム … 続きを読む

カテゴリー: cs.CV | Tiled Diffusion はコメントを受け付けていません

Learning Interpretable Logic Rules from Deep Vision Models

要約 VisionLogicと呼ばれる一般的なフレームワークを提案して、画像分類 … 続きを読む

カテゴリー: cs.CV | Learning Interpretable Logic Rules from Deep Vision Models はコメントを受け付けていません

MASQUE: A Text-Guided Diffusion-Based Framework for Localized and Customized Adversarial Makeup

要約 政府および商業サービスに顔認識がますます採用されるにつれて、その誤用の可能 … 続きを読む

カテゴリー: cs.CR, cs.CV | MASQUE: A Text-Guided Diffusion-Based Framework for Localized and Customized Adversarial Makeup はコメントを受け付けていません

Autoregressive Image Generation with Randomized Parallel Decoding

要約 ランダム化された並列生成を可能にする新しい視覚的自己回帰モデルであるARP … 続きを読む

カテゴリー: cs.CV | Autoregressive Image Generation with Randomized Parallel Decoding はコメントを受け付けていません

Semantic-Supervised Spatial-Temporal Fusion for LiDAR-based 3D Object Detection

要約 LIDARベースの3Dオブジェクト検出は、ライダーポイントの固有のスパース … 続きを読む

カテゴリー: cs.CV | Semantic-Supervised Spatial-Temporal Fusion for LiDAR-based 3D Object Detection はコメントを受け付けていません

VisualWebInstruct: Scaling up Multimodal Instruction Data through Web Search

要約 ビジョン言語モデルは、多くの知覚に焦点を当てたタスクで大きな進歩を遂げてい … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | VisualWebInstruct: Scaling up Multimodal Instruction Data through Web Search はコメントを受け付けていません

Unlock the Power of Unlabeled Data in Language Driving Model

要約 自律運転の最近のビジョンベースの大手言語モデル〜(Visionllms)は … 続きを読む

カテゴリー: cs.CV | Unlock the Power of Unlabeled Data in Language Driving Model はコメントを受け付けていません

Complexity Experts are Task-Discriminative Learners for Any Image Restoration

要約 オールインワン画像修復モデルの最近の進歩により、統一されたフレームワークを … 続きを読む

カテゴリー: cs.CV | Complexity Experts are Task-Discriminative Learners for Any Image Restoration はコメントを受け付けていません

Long Context Tuning for Video Generation

要約 ビデオ生成における最近の進歩は、スケーラブルな拡散トランスを備えた現実的で … 続きを読む

カテゴリー: cs.CV | Long Context Tuning for Video Generation はコメントを受け付けていません

CameraCtrl II: Dynamic Scene Exploration via Camera-controlled Video Diffusion Models

要約 このペーパーでは、Cameractrl IIを紹介します。これは、カメラ制 … 続きを読む

カテゴリー: cs.CV | CameraCtrl II: Dynamic Scene Exploration via Camera-controlled Video Diffusion Models はコメントを受け付けていません