cs.MM」カテゴリーアーカイブ

Multimodal Analogical Reasoning over Knowledge Graphs

要約 類推は人間の認知の基本であり、さまざまな分野で重要な位置を占めています。 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | Multimodal Analogical Reasoning over Knowledge Graphs はコメントを受け付けていません

Rate-Perception Optimized Preprocessing for Video Coding

要約 過去数十年で、従来のビデオ コーデックや学習ベースのビデオ コーデックなど … 続きを読む

カテゴリー: cs.CV, cs.MM, eess.IV | Rate-Perception Optimized Preprocessing for Video Coding はコメントを受け付けていません

LDMIC: Learning-based Distributed Multi-view Image Coding

要約 マルチビュー画像圧縮は、3D 関連のアプリケーションで重要な役割を果たしま … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM, eess.IV | LDMIC: Learning-based Distributed Multi-view Image Coding はコメントを受け付けていません

AccDecoder: Accelerated Decoding for Neural-enhanced Video Analytics

要約 ビデオ ストリームの品質は、ニューラル ネットワーク ベースのビデオ分析に … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.MM | AccDecoder: Accelerated Decoding for Neural-enhanced Video Analytics はコメントを受け付けていません

Side Eye: Characterizing the Limits of POV Acoustic Eavesdropping from Smartphone Cameras with Rolling Shutters and Movable Lenses

要約 私たちの研究では、スマートフォンのカメラに広く見られるローリング シャッタ … 続きを読む

カテゴリー: cs.CR, cs.CV, cs.MM, cs.SD, eess.AS | Side Eye: Characterizing the Limits of POV Acoustic Eavesdropping from Smartphone Cameras with Rolling Shutters and Movable Lenses はコメントを受け付けていません

Generative Colorization of Structured Mobile Web Pages

要約 色は Web ページの重要なデザイン要素であり、閲覧者の感情や Web サ … 続きを読む

カテゴリー: cs.CV, cs.MM | Generative Colorization of Structured Mobile Web Pages はコメントを受け付けていません

SoundSpaces 2.0: A Simulation Platform for Visual-Acoustic Learning

要約 3D 環境向けのオンザフライ ジオメトリベースのオーディオ レンダリングの … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | SoundSpaces 2.0: A Simulation Platform for Visual-Acoustic Learning はコメントを受け付けていません

SgVA-CLIP: Semantic-guided Visual Adapting of Vision-Language Models for Few-shot Image Classification

要約 少数ショット学習では大きな進歩がありましたが、既存の少数ショット画像分類方 … 続きを読む

カテゴリー: cs.CV, cs.MM | SgVA-CLIP: Semantic-guided Visual Adapting of Vision-Language Models for Few-shot Image Classification はコメントを受け付けていません

AccDecoder: Accelerated Decoding for Neural-enhanced Video Analytics

要約 ビデオ ストリームの品質は、ニューラル ネットワーク ベースのビデオ分析に … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.MM | AccDecoder: Accelerated Decoding for Neural-enhanced Video Analytics はコメントを受け付けていません

Sharp Eyes: A Salient Object Detector Working The Same Way as Human Visual Characteristics

要約 現在の方法では、マルチレベルの機能を集約するか、エッジとスケルトンを導入し … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | Sharp Eyes: A Salient Object Detector Working The Same Way as Human Visual Characteristics はコメントを受け付けていません