-
最近の投稿
- Improving Traffic Signal Data Quality for the Waymo Open Motion Dataset
- DaDu-Corki: Algorithm-Architecture Co-Design for Embodied AI-powered Robotic Manipulation
- MorphoCopter: Design, Modeling, and Control of a New Transformable Quad-Bi Copter
- Active Lubrication of Transluminal Medical Instruments
- Safe Navigation in Dynamic Environments using Density Functions
-
最近のコメント
表示できるコメントはありません。 cs.AI (39396) cs.CL (29819) cs.CV (44768) cs.HC (2997) cs.LG (44329) cs.RO (23544) cs.SY (3590) eess.IV (5138) eess.SY (3582) stat.ML (5760)
「eess.AS」カテゴリーアーカイブ
What Does an Audio Deepfake Detector Focus on? A Study in the Time Domain
要約 音声ディープフェイク検出 (ADD) モデルに説明を追加すると、意思決定プ … 続きを読む
Musical ethnocentrism in Large Language Models
要約 大規模言語モデル (LLM) は、トレーニング データのバイアス、ひいては … 続きを読む
Tune In, Act Up: Exploring the Impact of Audio Modality-Specific Edits on Large Audio Language Models in Jailbreak
要約 大規模言語モデル (LLM) は、さまざまな自然言語処理タスクにわたって優 … 続きを読む
Exploring Finetuned Audio-LLM on Heart Murmur Features
要約 オーディオの大規模言語モデル (LLM) は、人間の音声、音楽、環境音の認 … 続きを読む
Performance evaluation of SLAM-ASR: The Good, the Bad, the Ugly, and the Way Forward
要約 最近の研究では、音声基盤エンコーダと大規模言語モデル (LLM) の間の線 … 続きを読む
Long-Form Text-to-Music Generation with Adaptive Prompts: A Case of Study in Tabletop Role-Playing Games Soundtracks
要約 この論文では、テーブルトップ ロール プレイング ゲーム (TRPG) の … 続きを読む
FlanEC: Exploring Flan-T5 for Post-ASR Error Correction
要約 この論文では、自動音声認識 (ASR) 後の生成音声誤り訂正 (GenSE … 続きを読む
Audio Array-Based 3D UAV Trajectory Estimation with LiDAR Pseudo-Labeling
要約 小型無人航空機 (UAV) の普及が進むにつれ、公共の安全とプライバシーへ … 続きを読む
Audio Texture Manipulation by Exemplar-Based Analogy
要約 オーディオ テクスチャの操作には、聴覚要素の追加、削除、置換などの特定の変 … 続きを読む