cs.MM」カテゴリーアーカイブ

Lester: rotoscope animation through video object segmentation and tracking

要約 この記事では、ビデオからレトロスタイルの 2D アニメーションを自動的に合 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.MM | Lester: rotoscope animation through video object segmentation and tracking はコメントを受け付けていません

MM-Point: Multi-View Information-Enhanced Multi-Modal Self-Supervised 3D Point Cloud Understanding

要約 知覚では、複数の感覚情報が統合されて、2D ビューからの視覚情報が 3D … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | MM-Point: Multi-View Information-Enhanced Multi-Modal Self-Supervised 3D Point Cloud Understanding はコメントを受け付けていません

Leveraging Pre-Trained Autoencoders for Interpretable Prototype Learning of Music Audio

要約 我々は、プロトタイプ学習に基づいた音楽オーディオ分類の解釈可能なモデル P … 続きを読む

カテゴリー: cs.AI, cs.MM, cs.SD, eess.AS | Leveraging Pre-Trained Autoencoders for Interpretable Prototype Learning of Music Audio はコメントを受け付けていません

LL-GABR: Energy Efficient Live Video Streaming Using Reinforcement Learning

要約 近年、ライブ ビデオ ストリーミング用のアダプティブ ビットレート (AB … 続きを読む

カテゴリー: cs.AI, cs.MM | LL-GABR: Energy Efficient Live Video Streaming Using Reinforcement Learning はコメントを受け付けていません

Customizable Perturbation Synthesis for Robust SLAM Benchmarking

要約 堅牢性は、非構造化環境、特に同時ローカリゼーションとマッピング (SLAM … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM, cs.RO | Customizable Perturbation Synthesis for Robust SLAM Benchmarking はコメントを受け付けていません

Test-Time Backdoor Attacks on Multimodal Large Language Models

要約 バックドア攻撃は通常、トレーニング データを汚染することによって実行され、 … 続きを読む

カテゴリー: cs.CL, cs.CR, cs.CV, cs.LG, cs.MM | Test-Time Backdoor Attacks on Multimodal Large Language Models はコメントを受け付けていません

Synthesizing Sentiment-Controlled Feedback For Multimodal Text and Image Data

要約 テキストと画像の両方を含むマルチモーダルな入力に応じて感情制御されたフィー … 続きを読む

カテゴリー: cs.AI, cs.MM | Synthesizing Sentiment-Controlled Feedback For Multimodal Text and Image Data はコメントを受け付けていません

Human Aesthetic Preference-Based Large Text-to-Image Model Personalization: Kandinsky Generation as an Example

要約 ニューラル生成機能の進歩に伴い、アート コミュニティは絵画コンテンツの作成 … 続きを読む

カテゴリー: cs.AI, cs.HC, cs.MM | Human Aesthetic Preference-Based Large Text-to-Image Model Personalization: Kandinsky Generation as an Example はコメントを受け付けていません

Quantifying and Enhancing Multi-modal Robustness with Modality Preference

要約 マルチモーダル モデルは、さまざまなソースからの情報を効果的に統合する有望 … 続きを読む

カテゴリー: cs.CV, cs.MM | Quantifying and Enhancing Multi-modal Robustness with Modality Preference はコメントを受け付けていません

Scalable Diffusion Models with State Space Backbone

要約 この論文は、状態空間アーキテクチャに基づいて構築された拡散モデルのカテゴリ … 続きを読む

カテゴリー: cs.CV, cs.MM | Scalable Diffusion Models with State Space Backbone はコメントを受け付けていません