cs.MM」カテゴリーアーカイブ

QVRF: A Quantization-error-aware Variable Rate Framework for Learned Image Compression

要約 学習した画像圧縮は有望な圧縮性能を示していますが、広範囲にわたる可変ビット … 続きを読む

カテゴリー: cs.AI, cs.MM, eess.IV | QVRF: A Quantization-error-aware Variable Rate Framework for Learned Image Compression はコメントを受け付けていません

BIRD-PCC: Bi-directional Range Image-based Deep LiDAR Point Cloud Compression

要約 LiDAR センサーによって収集される大量のデータは、LiDAR ポイント … 続きを読む

カテゴリー: cs.MM, cs.RO | BIRD-PCC: Bi-directional Range Image-based Deep LiDAR Point Cloud Compression はコメントを受け付けていません

Video Question Answering Using CLIP-Guided Visual-Text Attention

要約 ビデオとテキストのクロスモーダル学習は、ビデオ質問応答 (VideoQA) … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM, I.2.10 | Video Question Answering Using CLIP-Guided Visual-Text Attention はコメントを受け付けていません

CaDM: Codec-aware Diffusion Modeling for Neural-enhanced Video Streaming

要約 近年、ストリーマーのアップリンク帯域幅に合わせてビデオ ビットストリームが … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.MM, eess.IV | CaDM: Codec-aware Diffusion Modeling for Neural-enhanced Video Streaming はコメントを受け付けていません

BIRD-PCC: Bi-directional Range Image-based Deep LiDAR Point Cloud Compression

要約 LiDAR センサーによって収集される大量のデータは、LiDAR ポイント … 続きを読む

カテゴリー: cs.MM, cs.RO | BIRD-PCC: Bi-directional Range Image-based Deep LiDAR Point Cloud Compression はコメントを受け付けていません

MultiViz: Towards Visualizing and Understanding Multimodal Models

要約 現実世界のアプリケーションに対するマルチモーダル モデルの可能性は、利害関 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | MultiViz: Towards Visualizing and Understanding Multimodal Models はコメントを受け付けていません

Leveraging Pre-trained AudioLDM for Sound Generation: A Benchmark Study

要約 ディープ ニューラル ネットワークは、最近、サウンド生成においてブレークス … 続きを読む

カテゴリー: cs.AI, cs.MM, cs.SD, eess.AS | Leveraging Pre-trained AudioLDM for Sound Generation: A Benchmark Study はコメントを受け付けていません

On the predictability in reversible steganography

要約 人工ニューラル ネットワークは、可逆ステガノグラフィのフロンティアを前進さ … 続きを読む

カテゴリー: cs.CV, cs.MM, eess.IV | On the predictability in reversible steganography はコメントを受け付けていません

Bayesian Neural Networks for Reversible Steganography

要約 最近の深層学習の進歩は、可逆ステガノグラフィの分野にパラダイム シフトをも … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.MM | Bayesian Neural Networks for Reversible Steganography はコメントを受け付けていません

Deep Learning for Predictive Analytics in Reversible Steganography

要約 深層学習は、可逆ステガノグラフィの有望なソリューションと見なされています。 … 続きを読む

カテゴリー: cs.CV, cs.MM, eess.IV | Deep Learning for Predictive Analytics in Reversible Steganography はコメントを受け付けていません