-
最近の投稿
- An Adversarial Analysis of Thompson Sampling for Full-information Online Learning: from Finite to Infinite Action Spaces
- Data-Constrained Synthesis of Training Data for De-Identification
- AlphaMaze: Enhancing Large Language Models’ Spatial Intelligence via GRPO
- Temporal Misalignment in ANN-SNN Conversion and Its Mitigation via Probabilistic Spiking Neurons
- ChatVLA: Unified Multimodal Understanding and Robot Control with Vision-Language-Action Model
-
最近のコメント
表示できるコメントはありません。 cs.AI (34033) cs.CL (25731) cs.CR (2616) cs.CV (39970) cs.LG (39035) cs.RO (19852) cs.SY (3019) eess.IV (4758) eess.SY (3013) stat.ML (5151)
「eess.AS」カテゴリーアーカイブ
Transformers and Large Language Models for Efficient Intrusion Detection Systems: A Comprehensive Survey
要約 Transformers LLM の大幅な進歩により、NLP はテキスト生 … 続きを読む
AdaptVC: High Quality Voice Conversion with Adaptive Learning
要約 音声変換の目標は、元の内容を保持しながら、ソース話者の音声を基準話者の音声 … 続きを読む
Optimizing Speech Multi-View Feature Fusion through Conditional Computation
要約 最近の進歩により、さまざまな音声関連タスクにおける自己教師あり学習 (SS … 続きを読む
Audio-visual Deepfake Detection With Local Temporal Inconsistencies
要約 この論文では、オーディオとビジュアルのモダリティ間のきめ細かい時間的不一致 … 続きを読む
AdaCS: Adaptive Normalization for Enhanced Code-Switching ASR
要約 センテンシャル内コードスイッチング (CS) は、単一の発話内で発生する言 … 続きを読む
Audio-CoT: Exploring Chain-of-Thought Reasoning in Large Audio Language Model
要約 Large Audio-Language Model (LALM) は、音 … 続きを読む
Joint Automatic Speech Recognition And Structure Learning For Better Speech Understanding
要約 音声言語理解 (SLU) は、音声の分野における構造予測タスクです。 最近 … 続きを読む
Estimating Musical Surprisal in Audio
要約 計算手法を使用して音楽の驚きの期待をモデル化する際に、自己回帰モデルからの … 続きを読む
The Sound of Water: Inferring Physical Properties from Pouring Liquids
要約 私たちは、視聴覚観察と、液体を注ぐという平凡だが興味深い日常活動の基礎とな … 続きを読む
Comparing Self-Supervised Learning Models Pre-Trained on Human Speech and Animal Vocalizations for Bioacoustics Processing
要約 自己教師あり学習 (SSL) 基盤モデルは、幅広いタスクに適用できる強力で … 続きを読む