cs.CV」カテゴリーアーカイブ

Sports-QA: A Large-Scale Video Question Answering Benchmark for Complex and Professional Sports

要約 質問に答えるためにスポーツ ビデオを推論することは、選手のトレーニングや情 … 続きを読む

カテゴリー: cs.CV | Sports-QA: A Large-Scale Video Question Answering Benchmark for Complex and Professional Sports はコメントを受け付けていません

Few-Shot Learner Generalizes Across AI-Generated Image Detection

要約 大規模な合成画像データセットでトレーニングされた現在の偽画像検出器は、限ら … 続きを読む

カテゴリー: cs.CV | Few-Shot Learner Generalizes Across AI-Generated Image Detection はコメントを受け付けていません

When No-Reference Image Quality Models Meet MAP Estimation in Diffusion Latents

要約 最新の非参照画質評価 (NR-IQA) モデルは、知覚される画質を効果的に … 続きを読む

カテゴリー: cs.CV | When No-Reference Image Quality Models Meet MAP Estimation in Diffusion Latents はコメントを受け付けていません

Admitting Ignorance Helps the Video Question Answering Models to Answer

要約 ディープラーニングと大規模な事前トレーニングのおかげで、ビデオ質問応答 ( … 続きを読む

カテゴリー: cs.CV | Admitting Ignorance Helps the Video Question Answering Models to Answer はコメントを受け付けていません

3VL: Using Trees to Improve Vision-Language Models’ Interpretability

要約 ビジョン言語モデル (VLM) は、画像とテキスト表現を調整するのに効果的 … 続きを読む

カテゴリー: cs.CV | 3VL: Using Trees to Improve Vision-Language Models’ Interpretability はコメントを受け付けていません

Solving Energy-Independent Density for CT Metal Artifact Reduction via Neural Representation

要約 X 線 CT では、金属材料の存在下で影や縞模様のアーチファクトが発生し、 … 続きを読む

カテゴリー: cs.CV | Solving Energy-Independent Density for CT Metal Artifact Reduction via Neural Representation はコメントを受け付けていません

ACE++: Instruction-Based Image Creation and Editing via Context-Aware Content Filling

要約 さまざまな画像生成および編集タスクに取り組む命令ベースの拡散フレームワーク … 続きを読む

カテゴリー: cs.CV | ACE++: Instruction-Based Image Creation and Editing via Context-Aware Content Filling はコメントを受け付けていません

SemTalk: Holistic Co-speech Motion Generation with Frame-level Semantic Emphasis

要約 良好な共同音声動作生成は、一般的なリズミカルな動作と、まれではあるが不可欠 … 続きを読む

カテゴリー: cs.CV | SemTalk: Holistic Co-speech Motion Generation with Frame-level Semantic Emphasis はコメントを受け付けていません

Exploring ChatGPT for Face Presentation Attack Detection in Zero and Few-Shot in-Context Learning

要約 この研究は、顔提示攻撃検出 (PAD) の競合代替手段としての ChatG … 続きを読む

カテゴリー: cs.CR, cs.CV | Exploring ChatGPT for Face Presentation Attack Detection in Zero and Few-Shot in-Context Learning はコメントを受け付けていません

Structural damage detection via hierarchical damage information with volumetric assessment

要約 構造健全性モニタリング (SHM) は、インフラストラクチャの安全性と寿命 … 続きを読む

カテゴリー: cs.CV | Structural damage detection via hierarchical damage information with volumetric assessment はコメントを受け付けていません