-
最近の投稿
- KISS-Matcher: Fast and Robust Point Cloud Registration Revisited
- Unpacking Failure Modes of Generative Policies: Runtime Monitoring of Consistency and Progress
- Mode-GS: Monocular Depth Guided Anchored 3D Gaussian Splatting for Robust Ground-View Scene Rendering
- A Universal Formulation for Path-Parametric Planning and Control
- Next Best Sense: Guiding Vision and Touch with FisherRF for 3D Gaussian Splatting
-
最近のコメント
表示できるコメントはありません。 cs.AI (27775) cs.CL (20990) cs.CR (2176) cs.CV (34489) cs.LG (32518) cs.RO (15916) cs.SY (2472) eess.IV (4231) eess.SY (2466) stat.ML (4356)
「cs.SD」カテゴリーアーカイブ
Multi-Task Learning for Lung sound & Lung disease classification
要約 近年、ディープラーニング技術の進歩により、医療診断の効率と精度が大幅に向上 … 続きを読む
As Good As A Coin Toss: Human detection of AI-generated images, videos, audio, and audiovisual stimuli
要約 合成メディアが次第にリアルになり、それを利用する障壁が下がり続けるにつれ、 … 続きを読む
Analyzing Musical Characteristics of National Anthems in Relation to Global Indices
要約 音楽は人々の心理や行動パターンの形成に大きな役割を果たしている。本論文では … 続きを読む
UniverSLU: Universal Spoken Language Understanding for Diverse Tasks with Natural Language Instructions
要約 最近の研究では、マルチタスク機能を持つ大規模な言語モデルを活用し、自然言語 … 続きを読む
PromptCodec: High-Fidelity Neural Speech Codec using Disentangled Representation Learning based Adaptive Feature-aware Prompt Encoders
要約 ニューラル・スピーチ・コーデックは、音声変換、テキスト音声合成などのような … 続きを読む
Zero-Shot Multi-Lingual Speaker Verification in Clinical Trials
要約 臨床試験には相当数の臨床医、患者、データ収集環境が関与するため、優れた品質 … 続きを読む
Africa-Centric Self-Supervised Pre-Training for Multilingual Speech Representation in a Sub-Saharan Context
要約 アフリカの音声のみを対象としてトレーニングされた、最初の自己教師あり多言語 … 続きを読む
LastResort at SemEval-2024 Task 3: Exploring Multimodal Emotion Cause Pair Extraction as Sequence Labelling Task
要約 会話は人間のコミュニケーションの最も自然な形式であり、それぞれの発話がさま … 続きを読む
MusiLingo: Bridging Music and Text with Pre-trained Language Models for Music Captioning and Query Response
要約 大規模言語モデル (LLM) は、マルチモーダルなアプリケーションにおいて … 続きを読む
SPMamba: State-space model is all you need in speech separation
要約 音声分離では、CNN ベースのモデルと Transformer ベースのモ … 続きを読む