cs.MM」カテゴリーアーカイブ

SoundSpaces 2.0: A Simulation Platform for Visual-Acoustic Learning

要約 3D 環境向けのオンザフライ ジオメトリベースのオーディオ レンダリングの … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | SoundSpaces 2.0: A Simulation Platform for Visual-Acoustic Learning はコメントを受け付けていません

SgVA-CLIP: Semantic-guided Visual Adapting of Vision-Language Models for Few-shot Image Classification

要約 少数ショット学習では大きな進歩がありましたが、既存の少数ショット画像分類方 … 続きを読む

カテゴリー: cs.CV, cs.MM | SgVA-CLIP: Semantic-guided Visual Adapting of Vision-Language Models for Few-shot Image Classification はコメントを受け付けていません

AccDecoder: Accelerated Decoding for Neural-enhanced Video Analytics

要約 ビデオ ストリームの品質は、ニューラル ネットワーク ベースのビデオ分析に … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.MM | AccDecoder: Accelerated Decoding for Neural-enhanced Video Analytics はコメントを受け付けていません

Sharp Eyes: A Salient Object Detector Working The Same Way as Human Visual Characteristics

要約 現在の方法では、マルチレベルの機能を集約するか、エッジとスケルトンを導入し … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | Sharp Eyes: A Salient Object Detector Working The Same Way as Human Visual Characteristics はコメントを受け付けていません

Reduced-Reference Quality Assessment of Point Clouds via Content-Oriented Saliency Projection

要約 多くの高密度 3D 点群が、従来の画像やビデオの代わりに視覚オブジェクトを … 続きを読む

カテゴリー: cs.CV, cs.MM | Reduced-Reference Quality Assessment of Point Clouds via Content-Oriented Saliency Projection はコメントを受け付けていません

Semi-Supervised Semantic Segmentation Methods for UW-OCTA Diabetic Retinopathy Grade Assessment

要約 糖尿病の人は、健康な人よりも糖尿病性網膜症 (DR) を発症する可能性が高 … 続きを読む

カテゴリー: cs.CV, cs.MM | Semi-Supervised Semantic Segmentation Methods for UW-OCTA Diabetic Retinopathy Grade Assessment はコメントを受け付けていません

Scene-centric vs. Object-centric Image-Text Cross-modal Retrieval: A Reproducibility Study

要約 クロスモーダル検索 (CMR) へのほとんどのアプローチは、オブジェクト中 … 続きを読む

カテゴリー: cs.CV, cs.IR, cs.LG, cs.MM | Scene-centric vs. Object-centric Image-Text Cross-modal Retrieval: A Reproducibility Study はコメントを受け付けていません

A Dietary Nutrition-aided Healthcare Platform via Effective Food Recognition on a Localized Singaporean Food Dataset

要約 ローカライズされた食品データセットは、国の特別な料理を明らかにして人々の食 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.DB, cs.LG, cs.MM | A Dietary Nutrition-aided Healthcare Platform via Effective Food Recognition on a Localized Singaporean Food Dataset はコメントを受け付けていません

Vision Transformers Are Good Mask Auto-Labelers

要約 我々は、ボックスアノテーションのみを用いたインスタンスセグメンテーションの … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.MM | Vision Transformers Are Good Mask Auto-Labelers はコメントを受け付けていません

Text2Poster: Laying out Stylized Texts on Retrieved Images

要約 ポスターの生成は様々な用途で重要なタスクですが、多くの場合、時間がかかり、 … 続きを読む

カテゴリー: cs.CV, cs.MM | Text2Poster: Laying out Stylized Texts on Retrieved Images はコメントを受け付けていません