-
最近の投稿
- Solving Multi-Agent Safe Optimal Control with Distributed Epigraph Form MARL
- Nearly Optimal Nonlinear Safe Control with BaS-SDRE
- Field Report on Ground Penetrating Radar for Localization at the Mars Desert Research Station
- LAPP: Large Language Model Feedback for Preference-Driven Reinforcement Learning
- CityWalker: Learning Embodied Urban Navigation from Web-Scale Videos
-
最近のコメント
表示できるコメントはありません。 cs.AI (36968) cs.CL (27986) cs.CV (42734) cs.HC (2830) cs.LG (41908) cs.RO (21895) cs.SY (3335) eess.IV (4980) eess.SY (3327) stat.ML (5485)
「cs.SD」カテゴリーアーカイブ
Leveraging Spatial Cues from Cochlear Implant Microphones to Efficiently Enhance Speech Separation in Real-World Listening Scenes
要約 シングルチャネルの音声分離アプローチ、乾燥音声混合物は大幅に改善されました … 続きを読む
What Does an Audio Deepfake Detector Focus on? A Study in the Time Domain
要約 音声ディープフェイク検出 (ADD) モデルに説明を追加すると、意思決定プ … 続きを読む
Musical ethnocentrism in Large Language Models
要約 大規模言語モデル (LLM) は、トレーニング データのバイアス、ひいては … 続きを読む
Tune In, Act Up: Exploring the Impact of Audio Modality-Specific Edits on Large Audio Language Models in Jailbreak
要約 大規模言語モデル (LLM) は、さまざまな自然言語処理タスクにわたって優 … 続きを読む
Exploring Finetuned Audio-LLM on Heart Murmur Features
要約 オーディオの大規模言語モデル (LLM) は、人間の音声、音楽、環境音の認 … 続きを読む
Performance evaluation of SLAM-ASR: The Good, the Bad, the Ugly, and the Way Forward
要約 最近の研究では、音声基盤エンコーダと大規模言語モデル (LLM) の間の線 … 続きを読む
Long-Form Text-to-Music Generation with Adaptive Prompts: A Case of Study in Tabletop Role-Playing Games Soundtracks
要約 この論文では、テーブルトップ ロール プレイング ゲーム (TRPG) の … 続きを読む
FlanEC: Exploring Flan-T5 for Post-ASR Error Correction
要約 この論文では、自動音声認識 (ASR) 後の生成音声誤り訂正 (GenSE … 続きを読む
Audio Array-Based 3D UAV Trajectory Estimation with LiDAR Pseudo-Labeling
要約 小型無人航空機 (UAV) の普及が進むにつれ、公共の安全とプライバシーへ … 続きを読む
Audio Texture Manipulation by Exemplar-Based Analogy
要約 オーディオ テクスチャの操作には、聴覚要素の追加、削除、置換などの特定の変 … 続きを読む