-
最近の投稿
- Nearest-Neighbourless Asymptotically Optimal Motion Planning with Fully Connected Informed Trees (FCIT*)
- Performance assessment of ADAS in a representative subset of critical traffic situations
- Exciting Contact Modes in Differentiable Simulations for Robot Learning
- Can LLMs plan paths in the real world?
- DECODE: Domain-aware Continual Domain Expansion for Motion Prediction
-
最近のコメント
表示できるコメントはありません。 cs.AI (30257) cs.CL (22857) cs.CR (2346) cs.CV (36632) cs.LG (35077) cs.RO (17603) cs.SY (2704) eess.IV (4458) eess.SY (2698) stat.ML (4675)
「eess.AS」カテゴリーアーカイブ
Visual Echoes: A Simple Unified Transformer for Audio-Visual Generation
要約 近年、現実的な生成結果と幅広いパーソナライズされたアプリケーションにより、 … 続きを読む
A Dataset and Baselines for Measuring and Predicting the Music Piece Memorability
要約 今日、人類は自発的なストリーミング サービスやコマーシャルの休憩中の偶然の … 続きを読む
Blind Separation of Vibration Sources using Deep Learning and Deconvolution
要約 回転機械の振動は主に 2 つの発生源から発生します。どちらの発生源も、セン … 続きを読む
Images that Sound: Composing Images and Sounds on a Single Canvas
要約 スペクトログラムは、私たちの視覚世界にある画像とは大きく異なるサウンドの … 続きを読む
Naturalistic Music Decoding from EEG Data via Latent Diffusion Models
要約 この記事では、脳波 (EEG) 記録から自然な音楽を再構築するタスクに、強 … 続きを読む
Towards auditory attention decoding with noise-tagging: A pilot study
要約 聴覚注意デコーディング (AAD) は、脳活動から話者候補の中から注目して … 続きを読む
Building a Luganda Text-to-Speech Model From Crowdsourced Data
要約 ルガンダなどのアフリカ言語のテキスト読み上げ (TTS) 開発は依然として … 続きを読む
Listen Again and Choose the Right Answer: A New Paradigm for Automatic Speech Recognition with Large Language Models
要約 大規模言語モデル (LLM) の最近の進歩により、自動音声認識 (ASR) … 続きを読む
GenTranslate: Large Language Models are Generative Multilingual Speech and Machine Translators
要約 大規模言語モデル (LLM) の最近の進歩により、表現エラーが減少し、外部 … 続きを読む
Revisiting Deep Audio-Text Retrieval Through the Lens of Transportation
要約 Learning-to-match (LTM) フレームワークは、2 つの … 続きを読む