「cs.SD」カテゴリーアーカイブ

MAViL: Masked Audio-Video Learners

投稿日: 2022年12月16日作成者: jarxiv

要約オーディオビジュアル表現をトレーニングするために、Masked Audio … 続きを読む →

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

Dictionary Attacks on Speaker Verification

投稿日: 2022年12月13日作成者: jarxiv

要約この論文では、話者検証に対する辞書攻撃を提案します。これは、話者母集団の大 … 続きを読む →

カテゴリー: cs.CV, cs.SD, eess.AS | コメントを受け付けていません

Magic: Multi Art Genre Intelligent Choreography Dataset and Network for 3D Dance Generation

投稿日: 2022年12月9日作成者: jarxiv

要約マルチジャンルのデータセットがないため、特定の音楽から複数のジャンルと長期 … 続きを読む →

カテゴリー: cs.CV, cs.SD, eess.AS | コメントを受け付けていません

iQuery: Instruments as Queries for Audio-Visual Sound Separation

投稿日: 2022年12月9日作成者: jarxiv

要約現在のオーディオとビジュアルの分離方法は、オーディオエンコーダー/デコー … 続きを読む →

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

Magic: Multi Art Genre Intelligent Choreography Dataset and Network for 3D Dance Generation

投稿日: 2022年12月8日作成者: jarxiv

要約マルチジャンルのデータセットがないため、特定の音楽から複数のジャンルと長期 … 続きを読む →

カテゴリー: cs.CV, cs.SD, eess.AS | コメントを受け付けていません

iQuery: Instruments as Queries for Audio-Visual Sound Separation

投稿日: 2022年12月8日作成者: jarxiv

要約現在のオーディオとビジュアルの分離方法は、オーディオエンコーダー/デコー … 続きを読む →

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

Role of Audio in Audio-Visual Video Summarization

投稿日: 2022年12月5日作成者: jarxiv

要約映像の要約は、映像の表現、検索、閲覧を効率的に行い、映像の量やトラフィック … 続きを読む →

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

Cross-Modal Mutual Learning for Cued Speech Recognition

投稿日: 2022年12月5日作成者: jarxiv

要約 ACSR（Automatic Cued Speech Recognitio … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.SD, eess.AS | コメントを受け付けていません

Frequency of Interest-based Noise Attenuation Method to Improve Anomaly Detection Performance

投稿日: 2022年12月5日作成者: jarxiv

要約タイヤ摩擦ノーズに基づく異常検知タスクにおいて、走行イベントを正確に抽出す … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Frequency of Interest-based Noise Attenuation Method to Improve Anomaly Detection Performance

投稿日: 2022年12月2日作成者: jarxiv

要約運転イベントを正確に抽出することは、タイヤの摩擦ノーズに基づく異常検出タス … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

「cs.SD」カテゴリーアーカイブ

MAViL: Masked Audio-Video Learners

Dictionary Attacks on Speaker Verification

Magic: Multi Art Genre Intelligent Choreography Dataset and Network for 3D Dance Generation

iQuery: Instruments as Queries for Audio-Visual Sound Separation

Magic: Multi Art Genre Intelligent Choreography Dataset and Network for 3D Dance Generation

iQuery: Instruments as Queries for Audio-Visual Sound Separation

Role of Audio in Audio-Visual Video Summarization

Cross-Modal Mutual Learning for Cued Speech Recognition

Frequency of Interest-based Noise Attenuation Method to Improve Anomaly Detection Performance

Frequency of Interest-based Noise Attenuation Method to Improve Anomaly Detection Performance

最近の投稿

最近のコメント

アーカイブ

カテゴリー