-
最近の投稿
- Counter-Hypothetical Particle Filters for Single Object Pose Tracking
- Robust High-Speed State Estimation for Off-road Navigation using Radar Velocity Factors
- A Propagation Perspective on Recursive Forward Dynamics for Systems with Kinematic Loops
- D2S: Representing sparse descriptors and 3D coordinates for camera relocalization
- Geometric Graph Neural Network Modeling of Human Interactions in Crowded Environments
-
最近のコメント
表示できるコメントはありません。 cs.AI (28533) cs.CL (21568) cs.CR (2228) cs.CV (35151) cs.LG (33295) cs.RO (16470) cs.SY (2535) eess.IV (4282) eess.SY (2529) stat.ML (4465)
「eess.AS」カテゴリーアーカイブ
On Batching Variable Size Inputs for Training End-to-End Speech Enhancement Systems
要約 タイトル:エンドツーエンド音声強化システムのトレーニングにおける可変サイズ … 続きを読む
Dialog act guided contextual adapter for personalized speech recognition
要約 タイトル:パーソナライズド音声認識のためのダイアログアクト誘導コンテキスト … 続きを読む
Exploiting prompt learning with pre-trained language models for Alzheimer’s Disease detection
要約 タイトル:プレトレーニングされた言語モデルを用いたアルツハイマー病の検出に … 続きを読む
The Edinburgh International Accents of English Corpus: Towards the Democratization of English ASR
要約 タイトル:The Edinburgh International Acce … 続きを読む
Towards Unconstrained Audio Splicing Detection and Localization with Neural Networks
要約 タイトル:ニューラルネットワークを用いた自由な音声スプライスの検出と位置特 … 続きを読む
An efficient encoder-decoder architecture with top-down attention for speech separation
要約 タイトル: 階層的アテンションを用いた効率的なエンコーダーデコーダーアーキ … 続きを読む
Paraformer: Fast and Accurate Parallel Transformer for Non-autoregressive End-to-End Speech Recognition
要約 変圧器は最近、ASR 分野を支配しています。 優れたパフォーマンスを実現で … 続きを読む
WavCaps: A ChatGPT-Assisted Weakly-Labelled Audio Captioning Dataset for Audio-Language Multimodal Research
要約 オーディオ言語 (AL) マルチモーダル学習タスクの進歩は、近年重要です。 … 続きを読む
SynthVSR: Scaling Up Visual Speech Recognition With Synthetic Supervision
要約 最近報告された視覚的音声認識 (VSR) の最先端の結果は、ますます大量の … 続きを読む
Effective Audio Classification Network Based on Paired Inverse Pyramid Structure and Dense MLP Block
要約 最近では、畳み込みニューラル ネットワーク (CNN) と自己注意メカニズ … 続きを読む