「cs.MM」カテゴリーアーカイブ

Releasing the Parameter Latency of Neural Representation for High-Efficiency Video Compression

投稿日: 2024年10月4日作成者: jarxiv

要約何十年もの間、映像圧縮技術は著名な研究分野であった。従来のハイブリッド動画 … 続きを読む →

カテゴリー: cs.CV, cs.MM, eess.IV | コメントを受け付けていません

Unleashing Parameter Potential of Neural Representation for Efficient Video Compression

投稿日: 2024年10月3日作成者: jarxiv

要約何十年もの間、ビデオ圧縮テクノロジーは著名な研究分野でした。従来のハイブ … 続きを読む →

カテゴリー: cs.CV, cs.MM, eess.IV | コメントを受け付けていません

RADAR: Robust Two-stage Modality-incomplete Industrial Anomaly Detection

投稿日: 2024年10月3日作成者: jarxiv

要約 3D 点群と 2D RGB 画像を利用して製品の異常領域を特定するマルチモ … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

SVFAP: Self-supervised Video Facial Affect Perceiver

投稿日: 2024年10月2日作成者: jarxiv

要約ビデオベースの顔の感情分析は、人間とコンピューターのインタラクションにおい … 続きを読む →

カテゴリー: cs.CV, cs.HC, cs.MM | コメントを受け付けていません

FreeMask: Rethinking the Importance of Attention Masks for Zero-Shot Video Editing

投稿日: 2024年10月1日作成者: jarxiv

要約テキストからビデオへの普及モデルは目覚ましい進歩を遂げました。時間的に一 … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

Computer-mediated therapies for stroke rehabilitation: a systematic review and meta-Analysis

投稿日: 2024年10月1日作成者: jarxiv

要約目的: 脳卒中患者の身体的および心理的状態の改善における、従来の治療法 ( … 続きを読む →

カテゴリー: cs.AI, cs.HC, cs.MM, J.3.2, physics.med-ph | コメントを受け付けていません

Semi-Supervised Cognitive State Classification from Speech with Multi-View Pseudo-Labeling

投稿日: 2024年9月30日作成者: jarxiv

要約ラベル付きデータの欠如は、音声分類タスク、特に認知状態分類などの広範な主観 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

Rethinking Emotion Bias in Music via Frechet Audio Distance

投稿日: 2024年9月30日作成者: jarxiv

要約音楽の感情の主観的な性質により、特に単一のオーディオエンコーダー、感情分 … 続きを読む →

カテゴリー: cs.CL, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

Beyond Single-Audio: Advancing Multi-Audio Processing in Audio Large Language Models

投稿日: 2024年9月30日作成者: jarxiv

要約最近、単一の統合モデルを使用してさまざまなオーディオタスクに同時に取り組 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

Improving Visual Object Tracking through Visual Prompting

投稿日: 2024年9月30日作成者: jarxiv

要約一般的な視覚オブジェクトの追跡には、ターゲットを周囲の気を散らすものから区 … 続きを読む →

カテゴリー: 68, cs.AI, cs.CV, cs.MM, eess.IV, I.2 | コメントを受け付けていません

「cs.MM」カテゴリーアーカイブ

Releasing the Parameter Latency of Neural Representation for High-Efficiency Video Compression

Unleashing Parameter Potential of Neural Representation for Efficient Video Compression

RADAR: Robust Two-stage Modality-incomplete Industrial Anomaly Detection

SVFAP: Self-supervised Video Facial Affect Perceiver

FreeMask: Rethinking the Importance of Attention Masks for Zero-Shot Video Editing

Computer-mediated therapies for stroke rehabilitation: a systematic review and meta-Analysis

Semi-Supervised Cognitive State Classification from Speech with Multi-View Pseudo-Labeling

Rethinking Emotion Bias in Music via Frechet Audio Distance

Beyond Single-Audio: Advancing Multi-Audio Processing in Audio Large Language Models

Improving Visual Object Tracking through Visual Prompting

最近の投稿

最近のコメント

アーカイブ

カテゴリー