-
最近の投稿
- KISS-Matcher: Fast and Robust Point Cloud Registration Revisited
- Unpacking Failure Modes of Generative Policies: Runtime Monitoring of Consistency and Progress
- Mode-GS: Monocular Depth Guided Anchored 3D Gaussian Splatting for Robust Ground-View Scene Rendering
- A Universal Formulation for Path-Parametric Planning and Control
- Next Best Sense: Guiding Vision and Touch with FisherRF for 3D Gaussian Splatting
-
最近のコメント
表示できるコメントはありません。 cs.AI (27775) cs.CL (20990) cs.CR (2176) cs.CV (34489) cs.LG (32518) cs.RO (15916) cs.SY (2472) eess.IV (4231) eess.SY (2466) stat.ML (4356)
「eess.AS」カテゴリーアーカイブ
Analyzing Musical Characteristics of National Anthems in Relation to Global Indices
要約 音楽は人々の心理や行動パターンの形成に大きな役割を果たしている。本論文では … 続きを読む
The VoicePrivacy 2024 Challenge Evaluation Plan
要約 この課題の課題は、言語的な内容や感情の状態を保護しつつ、話者の声の身元を隠 … 続きを読む
Encoding of lexical tone in self-supervised models of spoken language
要約 解釈可能性の研究により、自己教師付き音声言語モデル(SLM)は、音響、音声 … 続きを読む
ART: The Alternating Reading Task Corpus for Speech Entrainment and Imitation
要約 音声コミュニケーションにおける同調行動と模倣行動を研究するために、二人組に … 続きを読む
UniverSLU: Universal Spoken Language Understanding for Diverse Tasks with Natural Language Instructions
要約 最近の研究では、マルチタスク機能を持つ大規模な言語モデルを活用し、自然言語 … 続きを読む
Zero-Shot Multi-Lingual Speaker Verification in Clinical Trials
要約 臨床試験には相当数の臨床医、患者、データ収集環境が関与するため、優れた品質 … 続きを読む
Africa-Centric Self-Supervised Pre-Training for Multilingual Speech Representation in a Sub-Saharan Context
要約 アフリカの音声のみを対象としてトレーニングされた、最初の自己教師あり多言語 … 続きを読む
LastResort at SemEval-2024 Task 3: Exploring Multimodal Emotion Cause Pair Extraction as Sequence Labelling Task
要約 会話は人間のコミュニケーションの最も自然な形式であり、それぞれの発話がさま … 続きを読む
MusiLingo: Bridging Music and Text with Pre-trained Language Models for Music Captioning and Query Response
要約 大規模言語モデル (LLM) は、マルチモーダルなアプリケーションにおいて … 続きを読む
SPMamba: State-space model is all you need in speech separation
要約 音声分離では、CNN ベースのモデルと Transformer ベースのモ … 続きを読む