「cs.MM」カテゴリーアーカイブ

Multimodal Analogical Reasoning over Knowledge Graphs

投稿日: 2023年1月26日作成者: jarxiv

要約類推は人間の認知の基本であり、さまざまな分野で重要な位置を占めています。 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | コメントを受け付けていません

Rate-Perception Optimized Preprocessing for Video Coding

投稿日: 2023年1月26日作成者: jarxiv

要約過去数十年で、従来のビデオコーデックや学習ベースのビデオコーデックなど … 続きを読む →

カテゴリー: cs.CV, cs.MM, eess.IV | コメントを受け付けていません

LDMIC: Learning-based Distributed Multi-view Image Coding

投稿日: 2023年1月25日作成者: jarxiv

要約マルチビュー画像圧縮は、3D 関連のアプリケーションで重要な役割を果たしま … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM, eess.IV | コメントを受け付けていません

AccDecoder: Accelerated Decoding for Neural-enhanced Video Analytics

投稿日: 2023年1月25日作成者: jarxiv

要約ビデオストリームの品質は、ニューラルネットワークベースのビデオ分析に … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.MM | コメントを受け付けていません

Side Eye: Characterizing the Limits of POV Acoustic Eavesdropping from Smartphone Cameras with Rolling Shutters and Movable Lenses

投稿日: 2023年1月25日作成者: jarxiv

要約私たちの研究では、スマートフォンのカメラに広く見られるローリングシャッタ … 続きを読む →

カテゴリー: cs.CR, cs.CV, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

Generative Colorization of Structured Mobile Web Pages

投稿日: 2023年1月24日作成者: jarxiv

要約色は Web ページの重要なデザイン要素であり、閲覧者の感情や Web サ … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

SoundSpaces 2.0: A Simulation Platform for Visual-Acoustic Learning

投稿日: 2023年1月24日作成者: jarxiv

要約 3D 環境向けのオンザフライジオメトリベースのオーディオレンダリングの … 続きを読む →

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

SgVA-CLIP: Semantic-guided Visual Adapting of Vision-Language Models for Few-shot Image Classification

投稿日: 2023年1月23日作成者: jarxiv

要約少数ショット学習では大きな進歩がありましたが、既存の少数ショット画像分類方 … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

AccDecoder: Accelerated Decoding for Neural-enhanced Video Analytics

投稿日: 2023年1月23日作成者: jarxiv

要約ビデオストリームの品質は、ニューラルネットワークベースのビデオ分析に … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.MM | コメントを受け付けていません

Sharp Eyes: A Salient Object Detector Working The Same Way as Human Visual Characteristics

投稿日: 2023年1月19日作成者: jarxiv

要約現在の方法では、マルチレベルの機能を集約するか、エッジとスケルトンを導入し … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM | コメントを受け付けていません

「cs.MM」カテゴリーアーカイブ

Multimodal Analogical Reasoning over Knowledge Graphs

Rate-Perception Optimized Preprocessing for Video Coding

LDMIC: Learning-based Distributed Multi-view Image Coding

AccDecoder: Accelerated Decoding for Neural-enhanced Video Analytics

Side Eye: Characterizing the Limits of POV Acoustic Eavesdropping from Smartphone Cameras with Rolling Shutters and Movable Lenses

Generative Colorization of Structured Mobile Web Pages

SoundSpaces 2.0: A Simulation Platform for Visual-Acoustic Learning

SgVA-CLIP: Semantic-guided Visual Adapting of Vision-Language Models for Few-shot Image Classification

AccDecoder: Accelerated Decoding for Neural-enhanced Video Analytics

Sharp Eyes: A Salient Object Detector Working The Same Way as Human Visual Characteristics

最近の投稿

最近のコメント

アーカイブ

カテゴリー