-
最近の投稿
- Open Challenges in the Formal Verification of Autonomous Driving
- Maximum Solar Energy Tracking Leverage High-DoF Robotics System with Deep Reinforcement Learning
- EdgeFlowNet: 100FPS@1W Dense Optical Flow For Tiny Mobile Robots
- A Systematic Study of Multi-Agent Deep Reinforcement Learning for Safe and Robust Autonomous Highway Ramp Entry
- Beyond Joint Demonstrations: Personalized Expert Guidance for Efficient Multi-Agent Reinforcement Learning
-
最近のコメント
表示できるコメントはありません。 cs.AI (30057) cs.CL (22703) cs.CR (2332) cs.CV (36430) cs.LG (34881) cs.RO (17454) cs.SY (2679) eess.IV (4437) eess.SY (2673) stat.ML (4648)
「eess.AS」カテゴリーアーカイブ
Mini-Omni: Language Models Can Hear, Talk While Thinking in Streaming
要約 言語モデルの最近の進歩は大幅な進歩を遂げています。 GPT-4o は新たな … 続きを読む
Easy, Interpretable, Effective: openSMILE for voice deepfake detection
要約 この論文では、音声の信頼性とディープフェイク検出の分野における事実上の標準 … 続きを読む
Multi-modal Adversarial Training for Zero-Shot Voice Cloning
要約 与えられたテキストから音声を再構築するようにトレーニングされたテキスト読み … 続きを読む
SimpleSpeech 2: Towards Simple and Efficient Text-to-Speech with Flow-based Scalar Latent Transformer Diffusion Models
要約 Text-to-speech (TTS) を大規模なデータセットにスケーリ … 続きを読む
Beyond Levenshtein: Leveraging Multiple Algorithms for Robust Word Error Rate Computations And Granular Error Classifications
要約 単語誤り率 (WER) は、自動音声認識 (ASR) の精度の一般的な尺度 … 続きを読む
Easy, Interpretable, Effective: openSMILE for voice deepfake detection
要約 この論文では、音声の信頼性とディープフェイク検出の分野における事実上の標準 … 続きを読む
ModalityMirror: Improving Audio Classification in Modality Heterogeneity Federated Learning with Multimodal Distillation
要約 マルチモーダル Federated Learning では、クライアント … 続きを読む
Proceedings of The second international workshop on eXplainable AI for the Arts (XAIxArts)
要約 Explainable AI for the Arts (XAIxArts … 続きを読む
A Functional Trade-off between Prosodic and Semantic Cues in Conveying Sarcasm
要約 この研究では、皮肉の音響的特徴を調査し、皮肉として使用される発話の傾向と皮 … 続きを読む
Speech Recognition Transformers: Topological-lingualism Perspective
要約 トランスフォーマーは、さまざまな人工知能タスクにおいて大きな成功を収めなが … 続きを読む