投稿者「jarxiv」のアーカイブ

When No-Reference Image Quality Models Meet MAP Estimation in Diffusion Latents

要約 最新の非参照画質評価 (NR-IQA) モデルは、知覚される画質を効果的に … 続きを読む

カテゴリー: cs.CV | コメントする

Admitting Ignorance Helps the Video Question Answering Models to Answer

要約 ディープラーニングと大規模な事前トレーニングのおかげで、ビデオ質問応答 ( … 続きを読む

カテゴリー: cs.CV | コメントする

3VL: Using Trees to Improve Vision-Language Models’ Interpretability

要約 ビジョン言語モデル (VLM) は、画像とテキスト表現を調整するのに効果的 … 続きを読む

カテゴリー: cs.CV | コメントする

Solving Energy-Independent Density for CT Metal Artifact Reduction via Neural Representation

要約 X 線 CT では、金属材料の存在下で影や縞模様のアーチファクトが発生し、 … 続きを読む

カテゴリー: cs.CV | コメントする

ACE++: Instruction-Based Image Creation and Editing via Context-Aware Content Filling

要約 さまざまな画像生成および編集タスクに取り組む命令ベースの拡散フレームワーク … 続きを読む

カテゴリー: cs.CV | コメントする

SemTalk: Holistic Co-speech Motion Generation with Frame-level Semantic Emphasis

要約 良好な共同音声動作生成は、一般的なリズミカルな動作と、まれではあるが不可欠 … 続きを読む

カテゴリー: cs.CV | コメントする

Exploring ChatGPT for Face Presentation Attack Detection in Zero and Few-Shot in-Context Learning

要約 この研究は、顔提示攻撃検出 (PAD) の競合代替手段としての ChatG … 続きを読む

カテゴリー: cs.CR, cs.CV | コメントする

Structural damage detection via hierarchical damage information with volumetric assessment

要約 構造健全性モニタリング (SHM) は、インフラストラクチャの安全性と寿命 … 続きを読む

カテゴリー: cs.CV | コメントする

Multi-visual modality micro drone-based structural damage detection

要約 構造物損傷検出における物体検出器の正確な検出と回復力は、民間インフラの継続 … 続きを読む

カテゴリー: cs.CV | コメントする

Human Pose-Constrained UV Map Estimation

要約 UV マップ推定は、コンピューター ビジョンで人間の姿勢や活動を詳細に分析 … 続きを読む

カテゴリー: cs.CV | コメントする