「eess.AS」カテゴリーアーカイブ

Cross-Modal Mutual Learning for Cued Speech Recognition

投稿日: 2022年12月5日作成者: jarxiv

要約 ACSR（Automatic Cued Speech Recognitio … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.SD, eess.AS | コメントを受け付けていません

Frequency of Interest-based Noise Attenuation Method to Improve Anomaly Detection Performance

投稿日: 2022年12月5日作成者: jarxiv

要約タイヤ摩擦ノーズに基づく異常検知タスクにおいて、走行イベントを正確に抽出す … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Frequency of Interest-based Noise Attenuation Method to Improve Anomaly Detection Performance

投稿日: 2022年12月2日作成者: jarxiv

要約運転イベントを正確に抽出することは、タイヤの摩擦ノーズに基づく異常検出タス … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Automated Detection of Dolphin Whistles with Convolutional Networks and Transfer Learning

投稿日: 2022年11月29日作成者: jarxiv

要約海洋環境の効果的な保全と絶滅危惧種の野生生物管理には、環境モニタリングのた … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

ASiT: Audio Spectrogram vIsion Transformer for General Audio Representation

投稿日: 2022年11月24日作成者: jarxiv

要約もともと自然言語処理用に開発されたビジョントランスフォーマーは、長期的な … 続きを読む →

カテゴリー: cs.CV, cs.SD, eess.AS | コメントを受け付けていません

Masked Modeling Duo: Learning Representations by Encouraging Both Networks to Model the Input

投稿日: 2022年11月21日作成者: jarxiv

要約 Masked Autoencoders は、シンプルでありながら強力な自己 … 続きを読む →

カテゴリー: 68T07, cs.CV, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Listen, denoise, action! Audio-driven motion synthesis with diffusion models

投稿日: 2022年11月18日作成者: jarxiv

要約拡散モデルは、表現力が高く効率的にトレーニング可能な確率モデルとして関心が … 続きを読む →

カテゴリー: 68T07, cs.CV, cs.GR, cs.HC, cs.LG, cs.SD, eess.AS, G.3 | コメントを受け付けていません

FlowGrad: Using Motion for Visual Sound Source Localization

投稿日: 2022年11月16日作成者: jarxiv

要約視覚的な音源定位に関する最新の研究は、自己管理型の方法で学習されたセマンテ … 続きを読む →

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

Investigating Modality Bias in Audio Visual Video Parsing

投稿日: 2022年11月14日作成者: jarxiv

要約オーディオとビジュアルのイベントラベルを時間境界で検出することを含むオー … 続きを読む →

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS, eess.IV | コメントを受け付けていません

On the role of Lip Articulation in Visual Speech Perception

投稿日: 2022年11月11日作成者: jarxiv

要約オーディオからリアルな唇の動きを生成して音声生成をシミュレートすることは、 … 続きを読む →

カテゴリー: cs.CV, cs.GR, cs.SD, eess.AS | コメントを受け付けていません

「eess.AS」カテゴリーアーカイブ

Cross-Modal Mutual Learning for Cued Speech Recognition

Frequency of Interest-based Noise Attenuation Method to Improve Anomaly Detection Performance

Frequency of Interest-based Noise Attenuation Method to Improve Anomaly Detection Performance

Automated Detection of Dolphin Whistles with Convolutional Networks and Transfer Learning

ASiT: Audio Spectrogram vIsion Transformer for General Audio Representation

Masked Modeling Duo: Learning Representations by Encouraging Both Networks to Model the Input

Listen, denoise, action! Audio-driven motion synthesis with diffusion models

FlowGrad: Using Motion for Visual Sound Source Localization

Investigating Modality Bias in Audio Visual Video Parsing

On the role of Lip Articulation in Visual Speech Perception

最近の投稿

最近のコメント

アーカイブ

カテゴリー