-
最近の投稿
- Mastering Contact-rich Tasks by Combining Soft and Rigid Robotics with Imitation Learning
- From CAD to URDF: Co-Design of a Jet-Powered Humanoid Robot Including CAD Geometry
- SPA: 3D Spatial-Awareness Enables Effective Embodied Representation
- Lean Methodology for Garment Modernization
- Towards Synergistic, Generalized, and Efficient Dual-System for Robotic Manipulation
-
最近のコメント
表示できるコメントはありません。 cs.AI (27921) cs.CL (21096) cs.CR (2183) cs.CV (34619) cs.LG (32651) cs.RO (16028) cs.SY (2485) eess.IV (4238) eess.SY (2479) stat.ML (4372)
「cs.SD」カテゴリーアーカイブ
An Efficient Temporary Deepfake Location Approach Based Embeddings for Partially Spoofed Audio Detection
要約 部分的になりすました音声の検出は、フレーム レベルで音声の信頼性を正確に特 … 続きを読む
Indoor Localization Using Radio, Vision and Audio Sensors: Real-Life Data Validation and Discussion
要約 この論文では、同じ環境で無線センサー、視覚センサー、音声センサーをそれぞれ … 続きを読む
FSD: An Initial Chinese Dataset for Fake Song Detection
要約 歌声合成と歌声変換は大きく進化し、音楽体験に革命をもたらしました。 しかし … 続きを読む
Self-Similarity-Based and Novelty-based loss for music structure analysis
要約 音楽構造分析 (MSA) は、音楽トラックを構成する音楽セグメントを特定し … 続きを読む
TODM: Train Once Deploy Many Efficient Supernet-Based RNN-T Compression For On-device ASR Models
要約 自動音声認識 (ASR) モデルは、デバイスに展開する前に、特定のハードウ … 続きを読む
Evaluating Methods for Ground-Truth-Free Foreign Accent Conversion
要約 外国アクセント変換 (FAC) は、音声変換 (VC) の特別なアプリケー … 続きを読む
Bring the Noise: Introducing Noise Robustness to Pretrained Automatic Speech Recognition
要約 最近の研究では、音声処理の分野で、自動音声認識 (ASR) のための大規模 … 続きを読む
Identifying depression-related topics in smartphone-collected free-response speech recordings using an automatic speech recognition system and a deep learning topic model
要約 言語使用はうつ病と相関があることが示されていますが、大規模な検証が必要です … 続きを読む
PromptTTS 2: Describing and Generating Voices with Text Prompt
要約 同じ単語をさまざまな声で発声して多様な情報を伝えることができるため、音声は … 続きを読む
FSD: An Initial Chinese Dataset for Fake Song Detection
要約 歌声合成と歌声変換は大きく進化し、音楽体験に革命をもたらしました。 しかし … 続きを読む