eess.AS」カテゴリーアーカイブ

Cross-Modal Mutual Learning for Cued Speech Recognition

要約 ACSR(Automatic Cued Speech Recognitio … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.SD, eess.AS | Cross-Modal Mutual Learning for Cued Speech Recognition はコメントを受け付けていません

Frequency of Interest-based Noise Attenuation Method to Improve Anomaly Detection Performance

要約 タイヤ摩擦ノーズに基づく異常検知タスクにおいて、走行イベントを正確に抽出す … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.SD, eess.AS | Frequency of Interest-based Noise Attenuation Method to Improve Anomaly Detection Performance はコメントを受け付けていません

Frequency of Interest-based Noise Attenuation Method to Improve Anomaly Detection Performance

要約 運転イベントを正確に抽出することは、タイヤの摩擦ノーズに基づく異常検出タス … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.SD, eess.AS | Frequency of Interest-based Noise Attenuation Method to Improve Anomaly Detection Performance はコメントを受け付けていません

Automated Detection of Dolphin Whistles with Convolutional Networks and Transfer Learning

要約 海洋環境の効果的な保全と絶滅危惧種の野生生物管理には、環境モニタリングのた … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.SD, eess.AS | Automated Detection of Dolphin Whistles with Convolutional Networks and Transfer Learning はコメントを受け付けていません

ASiT: Audio Spectrogram vIsion Transformer for General Audio Representation

要約 もともと自然言語処理用に開発されたビジョン トランスフォーマーは、長期的な … 続きを読む

カテゴリー: cs.CV, cs.SD, eess.AS | ASiT: Audio Spectrogram vIsion Transformer for General Audio Representation はコメントを受け付けていません

Masked Modeling Duo: Learning Representations by Encouraging Both Networks to Model the Input

要約 Masked Autoencoders は、シンプルでありながら強力な自己 … 続きを読む

カテゴリー: 68T07, cs.CV, cs.LG, cs.SD, eess.AS | Masked Modeling Duo: Learning Representations by Encouraging Both Networks to Model the Input はコメントを受け付けていません

Listen, denoise, action! Audio-driven motion synthesis with diffusion models

要約 拡散モデルは、表現力が高く効率的にトレーニング可能な確率モデルとして関心が … 続きを読む

カテゴリー: 68T07, cs.CV, cs.GR, cs.HC, cs.LG, cs.SD, eess.AS, G.3 | Listen, denoise, action! Audio-driven motion synthesis with diffusion models はコメントを受け付けていません

FlowGrad: Using Motion for Visual Sound Source Localization

要約 視覚的な音源定位に関する最新の研究は、自己管理型の方法で学習されたセマンテ … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | FlowGrad: Using Motion for Visual Sound Source Localization はコメントを受け付けていません

Investigating Modality Bias in Audio Visual Video Parsing

要約 オーディオとビジュアルのイベント ラベルを時間境界で検出することを含むオー … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS, eess.IV | Investigating Modality Bias in Audio Visual Video Parsing はコメントを受け付けていません

On the role of Lip Articulation in Visual Speech Perception

要約 オーディオからリアルな唇の動きを生成して音声生成をシミュレートすることは、 … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.SD, eess.AS | On the role of Lip Articulation in Visual Speech Perception はコメントを受け付けていません