cs.CV」カテゴリーアーカイブ

Remote Sensing Temporal Vision-Language Models: A Comprehensive Survey

要約 リモートセンシングにおける時間画像解析は、従来、異なる時間に撮影された画像 … 続きを読む

カテゴリー: cs.CV | Remote Sensing Temporal Vision-Language Models: A Comprehensive Survey はコメントを受け付けていません

Copy-Move Forgery Detection and Question Answering for Remote Sensing Image

要約 本稿では、リモートセンシング複写移動質問応答(RSCMQA)のタスクを紹介 … 続きを読む

カテゴリー: cs.CV, cs.MM | Copy-Move Forgery Detection and Question Answering for Remote Sensing Image はコメントを受け付けていません

dc-GAN: Dual-Conditioned GAN for Face Demorphing From a Single Morph

要約 顔モーフとは、2つの異なるアイデンティティに関連する2つの顔画像を組み合わ … 続きを読む

カテゴリー: cs.CV | dc-GAN: Dual-Conditioned GAN for Face Demorphing From a Single Morph はコメントを受け付けていません

MedTet: An Online Motion Model for 4D Heart Reconstruction

要約 我々は、スパースな術中データから3次元心臓運動を再構成する新しいアプローチ … 続きを読む

カテゴリー: cs.CV | MedTet: An Online Motion Model for 4D Heart Reconstruction はコメントを受け付けていません

LumiNet: Latent Intrinsics Meets Diffusion Models for Indoor Scene Relighting

要約 我々は、効果的な照明転送のために生成モデルと潜在的な固有表現を活用する新し … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.LG | LumiNet: Latent Intrinsics Meets Diffusion Models for Indoor Scene Relighting はコメントを受け付けていません

Denoising: A Powerful Building-Block for Imaging, Inverse Problems, and Machine Learning

要約 ノイズ除去とは、信号中のランダムな揺らぎを減少させ、本質的なパターンを強調 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Denoising: A Powerful Building-Block for Imaging, Inverse Problems, and Machine Learning はコメントを受け付けていません

OCR Hinders RAG: Evaluating the Cascading Impact of OCR on Retrieval-Augmented Generation

要約 検索補強型生成(RAG)は、外部知識を統合することによって大規模言語モデル … 続きを読む

カテゴリー: cs.CV | OCR Hinders RAG: Evaluating the Cascading Impact of OCR on Retrieval-Augmented Generation はコメントを受け付けていません

Class-wise Autoencoders Measure Classification Difficulty And Detect Label Mistakes

要約 個々のクラスで学習されたオートエンコーダ間の再構成誤差の比率に基づく、分類 … 続きを読む

カテゴリー: cs.CV, cs.LG | Class-wise Autoencoders Measure Classification Difficulty And Detect Label Mistakes はコメントを受け付けていません

MERGE: Multi-faceted Hierarchical Graph-based GNN for Gene Expression Prediction from Whole Slide Histopathology Images

要約 空間トランスクリプトミクス(Spatial Transcriptomics … 続きを読む

カテゴリー: cs.CV | MERGE: Multi-faceted Hierarchical Graph-based GNN for Gene Expression Prediction from Whole Slide Histopathology Images はコメントを受け付けていません

AV-Odyssey Bench: Can Your Multimodal LLMs Really Understand Audio-Visual Information?

要約 近年、GPT-4o、Gemini 1.5 Pro、Reka Coreなどの … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM, cs.SD, eess.AS | AV-Odyssey Bench: Can Your Multimodal LLMs Really Understand Audio-Visual Information? はコメントを受け付けていません