月別アーカイブ: 2023年6月

Lesion Detection on Leaves using Class Activation Maps

要約 植物の葉の病変の検出は、植物病理学および農業研究において重要なタスクです。 … 続きを読む

カテゴリー: cs.AI, cs.CV | Lesion Detection on Leaves using Class Activation Maps はコメントを受け付けていません

Semi-Implicit Denoising Diffusion Models (SIDDMs)

要約 生成モデルの急増にもかかわらず、サンプルの多様性と品質を損なうことなく推論 … 続きを読む

カテゴリー: cs.CV, cs.LG | Semi-Implicit Denoising Diffusion Models (SIDDMs) はコメントを受け付けていません

First Place Solution to the CVPR’2023 AQTC Challenge: A Function-Interaction Centric Approach with Spatiotemporal Visual-Language Alignment

要約 アフォーダンス中心の質問主導型タスク完了 (AQTC) は、ビデオから知識 … 続きを読む

カテゴリー: cs.CV | First Place Solution to the CVPR’2023 AQTC Challenge: A Function-Interaction Centric Approach with Spatiotemporal Visual-Language Alignment はコメントを受け付けていません

DiffInfinite: Large Mask-Image Synthesis via Parallel Random Patch Diffusion in Histopathology

要約 我々は、長距離相関構造情報を保存しながら任意に大きな組織学的画像を生成する … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | DiffInfinite: Large Mask-Image Synthesis via Parallel Random Patch Diffusion in Histopathology はコメントを受け付けていません

MME: A Comprehensive Evaluation Benchmark for Multimodal Large Language Models

要約 マルチモーダル大規模言語モデル (MLLM) は、強力な LLM に依存し … 続きを読む

カテゴリー: cs.CV | MME: A Comprehensive Evaluation Benchmark for Multimodal Large Language Models はコメントを受け付けていません

3D VR Sketch Guided 3D Shape Prototyping and Exploration

要約 3D 形状モデリングは多大な労力と時間がかかり、長年の専門知識が必要です。 … 続きを読む

カテゴリー: cs.CV | 3D VR Sketch Guided 3D Shape Prototyping and Exploration はコメントを受け付けていません

PP-GAN : Style Transfer from Korean Portraits to ID Photos Using Landmark Extractor with GAN

要約 スタイル転送の目的は、別の画像のスタイルを転送しながら、画像のコンテンツを … 続きを読む

カテゴリー: cs.CV | PP-GAN : Style Transfer from Korean Portraits to ID Photos Using Landmark Extractor with GAN はコメントを受け付けていません

Towards Unseen Triples: Effective Text-Image-joint Learning for Scene Graph Generation

要約 シーン グラフ生成 (SGG) は、画像内のオブジェクトとその接続を構造的 … 続きを読む

カテゴリー: cs.CV | Towards Unseen Triples: Effective Text-Image-joint Learning for Scene Graph Generation はコメントを受け付けていません

Day2Dark: Pseudo-Supervised Activity Recognition beyond Silent Daylight

要約 この論文は、日中だけでなく暗闇での活動を認識することに努めています。 私た … 続きを読む

カテゴリー: cs.CV | Day2Dark: Pseudo-Supervised Activity Recognition beyond Silent Daylight はコメントを受け付けていません

Summarize the Past to Predict the Future: Natural Language Descriptions of Context Boost Multimodal Object Interaction

要約 私たちは自己中心的なビデオにおけるオブジェクトの相互作用の予測を研究してい … 続きを読む

カテゴリー: cs.CL, cs.CV | Summarize the Past to Predict the Future: Natural Language Descriptions of Context Boost Multimodal Object Interaction はコメントを受け付けていません