月別アーカイブ: 2024年8月

Machine Learning for Methane Detection and Quantification from Space — A survey

要約 メタン (CH_4) は強力な人為起源の温室効果ガスであり、20 年間で二 … 続きを読む

カテゴリー: cs.CV, physics.ao-ph | Machine Learning for Methane Detection and Quantification from Space — A survey はコメントを受け付けていません

T-FAKE: Synthesizing Thermal Images for Facial Landmarking

要約 顔分析は、セキュリティ、自動運転、エンターテイメント、ヘルスケアなどの幅広 … 続きを読む

カテゴリー: cs.CV | T-FAKE: Synthesizing Thermal Images for Facial Landmarking はコメントを受け付けていません

RT-Attack: Jailbreaking Text-to-Image Models via Random Token

要約 最近、Text-to-Image (T2I) モデルは、画像の生成と編集に … 続きを読む

カテゴリー: cs.CR, cs.CV | RT-Attack: Jailbreaking Text-to-Image Models via Random Token はコメントを受け付けていません

A Preliminary Exploration Towards General Image Restoration

要約 ディープ モデルはさまざまな個別の画像復元タスクで多大な成功を収めているに … 続きを読む

カテゴリー: cs.CV | A Preliminary Exploration Towards General Image Restoration はコメントを受け付けていません

Empowering Sign Language Communication: Integrating Sentiment and Semantics for Facial Expression Synthesis

要約 書かれた文章を口頭言語から一連の手動および非手動のジェスチャーに翻訳するこ … 続きを読む

カテゴリー: cs.CV | Empowering Sign Language Communication: Integrating Sentiment and Semantics for Facial Expression Synthesis はコメントを受け付けていません

Zero-Shot Character Identification and Speaker Prediction in Comics via Iterative Multimodal Fusion

要約 キャラクターを認識し、会話の話者を予測することは、音声生成や翻訳などのコミ … 続きを読む

カテゴリー: cs.CV, cs.MM | Zero-Shot Character Identification and Speaker Prediction in Comics via Iterative Multimodal Fusion はコメントを受け付けていません

X-Reflect: Cross-Reflection Prompting for Multimodal Recommendation

要約 大規模言語モデル (LLM) と大規模マルチモーダル モデル (LMM) … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.IR | X-Reflect: Cross-Reflection Prompting for Multimodal Recommendation はコメントを受け付けていません

CNN-Transformer Rectified Collaborative Learning for Medical Image Segmentation

要約 自動かつ正確な医用画像セグメンテーション (MIS) は、臨床診断と分析に … 続きを読む

カテゴリー: cs.CV | CNN-Transformer Rectified Collaborative Learning for Medical Image Segmentation はコメントを受け付けていません

UWF-RI2FA: Generating Multi-frame Ultrawide-field Fluorescein Angiography from Ultrawide-field Retinal Imaging Improves Diabetic Retinopathy Stratification

要約 超広視野フルオレセイン血管造影 (UWF-FA) は、周辺網膜病変を鮮明に … 続きを読む

カテゴリー: cs.CV, eess.IV | UWF-RI2FA: Generating Multi-frame Ultrawide-field Fluorescein Angiography from Ultrawide-field Retinal Imaging Improves Diabetic Retinopathy Stratification はコメントを受け付けていません

A Review of Transformer-Based Models for Computer Vision Tasks: Capturing Global Context and Spatial Relationships

要約 トランスフォーマー ベースのモデルは、自然言語処理 (NLP) の状況を一 … 続きを読む

カテゴリー: cs.CV | A Review of Transformer-Based Models for Computer Vision Tasks: Capturing Global Context and Spatial Relationships はコメントを受け付けていません