-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.SD」カテゴリーアーカイブ
A Machine Learning Approach for Denoising and Upsampling HRTFs
要約 現実的な仮想没入型オーディオの需要は成長し続け、ヘッド関連の転送関数(HR … 続きを読む
Unleashing the Power of Natural Audio Featuring Multiple Sound Sources
要約 ユニバーサルサウンドセパレーションは、混合オーディオからの明確なイベントに … 続きを読む
Insect-Computer Hybrid Speaker: Speaker using Chirp of the Cicada Controlled by Electrical Muscle Stimulation
要約 「昆虫コンピューターハイブリッドスピーカー」を提案します。これにより、コン … 続きを読む
AudioX: Diffusion Transformer for Anything-to-Audio Generation
要約 オーディオと音楽の生成は、多くのアプリケーションで重要なタスクとして浮上し … 続きを読む
VocalNet: Speech LLM with Multi-Token Prediction for Faster and High-Quality Generation
要約 音声大規模な言語モデル(LLM)は、音声処理における顕著な研究の焦点として … 続きを読む
Multimodal Laryngoscopic Video Analysis for Assisted Diagnosis of Vocal Fold Paralysis
要約 このホワイトペーパーでは、オーディオデータとビデオデータの両方を活用して、 … 続きを読む
Histogram-based Parameter-efficient Tuning for Passive Sonar Classification
要約 パラメーター効率の高い転送学習(PETL)メソッドは、モデル全体を微調整す … 続きを読む
Histogram-based Parameter-efficient Tuning for Passive Sonar Classification
要約 パラメーター効率の高い転送学習(PETL)メソッドは、モデル全体を微調整す … 続きを読む
DRAGON: Distributional Rewards Optimize Diffusion Generative Models
要約 微調整されたメディア生成モデルの希望の結果に向けて、生成最適化(Drago … 続きを読む