-
最近の投稿
- Open Challenges in the Formal Verification of Autonomous Driving
- Maximum Solar Energy Tracking Leverage High-DoF Robotics System with Deep Reinforcement Learning
- EdgeFlowNet: 100FPS@1W Dense Optical Flow For Tiny Mobile Robots
- A Systematic Study of Multi-Agent Deep Reinforcement Learning for Safe and Robust Autonomous Highway Ramp Entry
- Beyond Joint Demonstrations: Personalized Expert Guidance for Efficient Multi-Agent Reinforcement Learning
-
最近のコメント
表示できるコメントはありません。 cs.AI (30057) cs.CL (22703) cs.CR (2332) cs.CV (36430) cs.LG (34881) cs.RO (17454) cs.SY (2679) eess.IV (4437) eess.SY (2673) stat.ML (4648)
「eess.AS」カテゴリーアーカイブ
MAT-SED: AMasked Audio Transformer with Masked-Reconstruction Based Pre-training for Sound Event Detection
要約 大規模な事前トレーニング済み Transformer エンコーダ ネットワ … 続きを読む
ASVspoof 5: Crowdsourced Speech Data, Deepfakes, and Adversarial Attacks at Scale
要約 ASVspoof 5 は、音声スプーフィングとディープフェイク攻撃の研究、 … 続きを読む
Multimodal Emotion Recognition using Audio-Video Transformer Fusion with Cross Attention
要約 感情を理解することは、人間のコミュニケーションの基本的な側面です。 オーデ … 続きを読む
Enhancing Large Language Model-based Speech Recognition by Contextualization for Rare and Ambiguous Words
要約 私たちは、テキスト プロンプトで事前情報としてキーワードを提供することで文 … 続きを読む
A Multi-Stream Fusion Approach with One-Class Learning for Audio-Visual Deepfake Detection
要約 この論文では、堅牢なオーディオビジュアルディープフェイク検出モデルを開発す … 続きを読む
Optimising MFCC parameters for the automatic detection of respiratory diseases
要約 気道から発信される音声信号は、呼吸器疾患の診断と評価のための貴重な音響バイ … 続きを読む
Spoken Stereoset: On Evaluating Social Bias Toward Speaker in Speech Large Language Models
要約 警告: この文書には不快な内容のテキストが含まれている可能性があります。 … 続きを読む
WavLLM: Towards Robust and Adaptive Speech Large Language Model
要約 大規模言語モデル (LLM) の最近の進歩は、自然言語処理の分野に革命をも … 続きを読む
PeriodWave: Multi-Period Flow Matching for High-Fidelity Waveform Generation
要約 最近、さまざまな配布外シナリオを条件としたユニバーサル波形生成タスクが研究 … 続きを読む