cs.CV」カテゴリーアーカイブ

VLEU: a Method for Automatic Evaluation for Generalizability of Text-to-Image Models

要約 Text-to-Image (T2I) モデルの進歩により、テキストの説明 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, I.2.10 | VLEU: a Method for Automatic Evaluation for Generalizability of Text-to-Image Models はコメントを受け付けていません

Visual question answering based evaluation metrics for text-to-image generation

要約 テキストから画像への生成とテキストによる画像操作は、画像生成タスクの分野で … 続きを読む

カテゴリー: cs.CV | Visual question answering based evaluation metrics for text-to-image generation はコメントを受け付けていません

Efficient Progressive Image Compression with Variance-aware Masking

要約 学習型プログレッシブ画像圧縮は、受信機でデコードされるビットが増えるにつれ … 続きを読む

カテゴリー: cs.CV | Efficient Progressive Image Compression with Variance-aware Masking はコメントを受け付けていません

Try-On-Adapter: A Simple and Flexible Try-On Paradigm

要約 オンライン ショッピングで広く使用されている画像ベースの仮想試着は、特定の … 続きを読む

カテゴリー: cs.CV | Try-On-Adapter: A Simple and Flexible Try-On Paradigm はコメントを受け付けていません

NeISF++: Neural Incident Stokes Field for Polarized Inverse Rendering of Conductors and Dielectrics

要約 最近の逆レンダリング手法では、偏光キューを利用することで形状、材質、照明の … 続きを読む

カテゴリー: cs.CV | NeISF++: Neural Incident Stokes Field for Polarized Inverse Rendering of Conductors and Dielectrics はコメントを受け付けていません

DiMoDif: Discourse Modality-information Differentiation for Audio-visual Deepfake Detection and Localization

要約 ディープフェイク技術は急速に進歩し、情報の完全性と社会的信頼に重大な脅威を … 続きを読む

カテゴリー: cs.CV | DiMoDif: Discourse Modality-information Differentiation for Audio-visual Deepfake Detection and Localization はコメントを受け付けていません

STLight: a Fully Convolutional Approach for Efficient Predictive Learning by Spatio-Temporal joint Processing

要約 時空間予測学習は、過去のフレームに基づいて将来のフレームを予測することで、 … 続きを読む

カテゴリー: cs.CV | STLight: a Fully Convolutional Approach for Efficient Predictive Learning by Spatio-Temporal joint Processing はコメントを受け付けていません

Q-VLM: Post-training Quantization for Large Vision-Language Models

要約 この論文では、効率的なマルチモーダル推論のための大規模ビジョン言語モデル … 続きを読む

カテゴリー: cs.CV | Q-VLM: Post-training Quantization for Large Vision-Language Models はコメントを受け付けていません

Block based Adaptive Compressive Sensing with Sampling Rate Control

要約 圧縮センシング (CS) は、ナイキスト レート以下の信号を取得して再構築 … 続きを読む

カテゴリー: cs.CV | Block based Adaptive Compressive Sensing with Sampling Rate Control はコメントを受け付けていません

Learning Generalizable 3D Manipulation With 10 Demonstrations

要約 デモンストレーションから堅牢で汎用性のある操作スキルを学習することは、産業 … 続きを読む

カテゴリー: cs.CV, cs.RO | Learning Generalizable 3D Manipulation With 10 Demonstrations はコメントを受け付けていません