cs.CV」カテゴリーアーカイブ

RecConv: Efficient Recursive Convolutions for Multi-Frequency Representations

要約 ビジョン トランスフォーマー (ViT) の最近の進歩により、グローバル … 続きを読む

カテゴリー: cs.CV | RecConv: Efficient Recursive Convolutions for Multi-Frequency Representations はコメントを受け付けていません

ReNeg: Learning Negative Embedding with Reward Guidance

要約 Text-to-Image (T2I) 生成アプリケーションでは、ネガティ … 続きを読む

カテゴリー: cs.CV | ReNeg: Learning Negative Embedding with Reward Guidance はコメントを受け付けていません

VideoMaker: Zero-shot Customized Video Generation with the Inherent Force of Video Diffusion Models

要約 ゼロショットのカスタマイズされたビデオ生成は、その大きな応用可能性により大 … 続きを読む

カテゴリー: cs.CV | VideoMaker: Zero-shot Customized Video Generation with the Inherent Force of Video Diffusion Models はコメントを受け付けていません

Chimera: A Block-Based Neural Architecture Search Framework for Event-Based Object Detection

要約 イベントベースのカメラは人間の目をシミュレートするセンサーであり、高速堅牢 … 続きを読む

カテゴリー: cs.AI, cs.CV | Chimera: A Block-Based Neural Architecture Search Framework for Event-Based Object Detection はコメントを受け付けていません

Enhancing Vision-Language Tracking by Effectively Converting Textual Cues into Visual Cues

要約 Vision-Language Tracking (VLT) は、視覚的な … 続きを読む

カテゴリー: cs.CV, cs.MM | Enhancing Vision-Language Tracking by Effectively Converting Textual Cues into Visual Cues はコメントを受け付けていません

Toward Modality Gap: Vision Prototype Learning for Weakly-supervised Semantic Segmentation with CLIP

要約 弱教師あり意味セグメンテーション (WSSS) における対照言語画像事前ト … 続きを読む

カテゴリー: cs.CV, cs.LG | Toward Modality Gap: Vision Prototype Learning for Weakly-supervised Semantic Segmentation with CLIP はコメントを受け付けていません

CustomCrafter: Customized Video Generation with Preserving Motion and Concept Composition Abilities

要約 カスタマイズされたビデオ生成は、テキスト プロンプトと被験者の参照画像に基 … 続きを読む

カテゴリー: cs.CV | CustomCrafter: Customized Video Generation with Preserving Motion and Concept Composition Abilities はコメントを受け付けていません

CAD-GPT: Synthesising CAD Construction Sequence with Spatial Reasoning-Enhanced Multimodal LLMs

要約 コンピュータ支援設計 (CAD) は、正確な 2D および 3D モデリン … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | CAD-GPT: Synthesising CAD Construction Sequence with Spatial Reasoning-Enhanced Multimodal LLMs はコメントを受け付けていません

Baichuan-Omni Technical Report

要約 GPT-4o の顕著なマルチモーダル機能とインタラクティブなエクスペリエン … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Baichuan-Omni Technical Report はコメントを受け付けていません

DLScanner: A parameter space scanner package assisted by deep learning methods

要約 このペーパーでは、深層学習 (DL) 技術によって強化されたスキャナー パ … 続きを読む

カテゴリー: cs.CV, hep-ex, hep-ph, hep-th | DLScanner: A parameter space scanner package assisted by deep learning methods はコメントを受け付けていません