「cs.MM」カテゴリーアーカイブ

Reduced-Reference Quality Assessment of Point Clouds via Content-Oriented Saliency Projection

投稿日: 2023年1月19日作成者: jarxiv

要約多くの高密度 3D 点群が、従来の画像やビデオの代わりに視覚オブジェクトを … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

Semi-Supervised Semantic Segmentation Methods for UW-OCTA Diabetic Retinopathy Grade Assessment

投稿日: 2023年1月16日作成者: jarxiv

要約糖尿病の人は、健康な人よりも糖尿病性網膜症 (DR) を発症する可能性が高 … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

Scene-centric vs. Object-centric Image-Text Cross-modal Retrieval: A Reproducibility Study

投稿日: 2023年1月13日作成者: jarxiv

要約クロスモーダル検索 (CMR) へのほとんどのアプローチは、オブジェクト中 … 続きを読む →

カテゴリー: cs.CV, cs.IR, cs.LG, cs.MM | コメントを受け付けていません

A Dietary Nutrition-aided Healthcare Platform via Effective Food Recognition on a Localized Singaporean Food Dataset

投稿日: 2023年1月11日作成者: jarxiv

要約ローカライズされた食品データセットは、国の特別な料理を明らかにして人々の食 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.DB, cs.LG, cs.MM | コメントを受け付けていません

Vision Transformers Are Good Mask Auto-Labelers

投稿日: 2023年1月11日作成者: jarxiv

要約我々は、ボックスアノテーションのみを用いたインスタンスセグメンテーションの … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.MM | コメントを受け付けていません

Text2Poster: Laying out Stylized Texts on Retrieved Images

投稿日: 2023年1月9日作成者: jarxiv

要約ポスターの生成は様々な用途で重要なタスクですが、多くの場合、時間がかかり、 … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

SPRING: Situated Conversation Agent Pretrained with Multimodal Questions from Incremental Layout Graph

投稿日: 2023年1月6日作成者: jarxiv

要約既存のマルチモーダル会話エージェントは、単純なシナリオでは絶対位置の特定や … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | コメントを受け付けていません

Attention-Aware Anime Line Drawing Colorization

投稿日: 2023年1月6日作成者: jarxiv

要約近年、アニメの線画の自動着色は、アニメ産業に多大な利益をもたらすことから注 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.GR, cs.MM | コメントを受け付けていません

Applicability limitations of differentiable full-reference image-quality

投稿日: 2023年1月5日作成者: jarxiv

要約画像処理アプリケーションの開発において、主観的な画質測定は重要な役割を担っ … 続きを読む →

カテゴリー: cs.CV, cs.GR, cs.MM, eess.IV, I.4.0 | コメントを受け付けていません

Training Vision-Language Transformers from Captions Alone

投稿日: 2023年1月4日作成者: jarxiv

要約 Vision-Language Transformersは、人間のラベル（ … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

「cs.MM」カテゴリーアーカイブ

Reduced-Reference Quality Assessment of Point Clouds via Content-Oriented Saliency Projection

Semi-Supervised Semantic Segmentation Methods for UW-OCTA Diabetic Retinopathy Grade Assessment

Scene-centric vs. Object-centric Image-Text Cross-modal Retrieval: A Reproducibility Study

A Dietary Nutrition-aided Healthcare Platform via Effective Food Recognition on a Localized Singaporean Food Dataset

Vision Transformers Are Good Mask Auto-Labelers

Text2Poster: Laying out Stylized Texts on Retrieved Images

SPRING: Situated Conversation Agent Pretrained with Multimodal Questions from Incremental Layout Graph

Attention-Aware Anime Line Drawing Colorization

Applicability limitations of differentiable full-reference image-quality

Training Vision-Language Transformers from Captions Alone

最近の投稿

最近のコメント

アーカイブ

カテゴリー