-
最近の投稿
- Grasp EveryThing (GET): 1-DoF, 3-Fingered Gripper with Tactile Sensing for Robust Grasping
- Neural Inertial Odometry from Lie Events
- Physical synchronization of soft self-oscillating limbs for fast and autonomous locomotion
- CRADMap: Applied Distributed Volumetric Mapping with 5G-Connected Multi-Robots and 4D Radar Perception
- Learning Rock Pushability on Rough Planetary Terrain
-
最近のコメント
表示できるコメントはありません。 cs.AI (38176) cs.CL (28850) cs.CV (43741) cs.HC (2915) cs.LG (43106) cs.RO (22722) cs.SY (3490) eess.IV (5071) eess.SY (3482) stat.ML (5612)
「cs.SD」カテゴリーアーカイブ
UniGlyph: A Seven-Segment Script for Universal Language Representation
要約 UniGlyph は、7 セグメント文字から派生したスクリプトを使用してユ … 続きを読む
Controlling Whisper: Universal Acoustic Adversarial Attacks to Control Speech Foundation Models
要約 柔軟な音声認識ベースのシステムまたは音声プロンプトの大規模言語モデル (L … 続きを読む
Sylber: Syllabic Embedding Representation of Speech from Raw Audio
要約 音節は、人間の音声の知覚と生成において重要な役割を果たす話し言葉の構成単位 … 続きを読む
CMMD: Contrastive Multi-Modal Diffusion for Video-Audio Conditional Modeling
要約 ビデオとオーディオの双方向の条件付き生成に合わせたマルチモーダル拡散モデル … 続きを読む
Presto! Distilling Steps and Layers for Accelerating Music Generation
要約 拡散ベースのテキスト音楽変換 (TTM) 手法は進歩していますが、効率的で … 続きを読む
Non-Invasive Suicide Risk Prediction Through Speech Analysis
要約 救急部門での専門的な精神医学的評価と自殺傾向のリスクのある患者へのケアへの … 続きを読む
Audio-Agent: Leveraging LLMs For Audio Generation, Editing and Composition
要約 テキストやビデオ入力に基づく音声生成、編集、作曲のためのマルチモーダルフレ … 続きを読む
SonicSense: Object Perception from In-Hand Acoustic Vibration
要約 SonicSenseを紹介する。SonicSenseは、ハードウェアとソフ … 続きを読む
Enhancing the analysis of murine neonatal ultrasonic vocalizations: Development, evaluation, and application of different mathematical models
要約 げっ歯類は、社会的コミュニケーションのために広範囲の超音波発声 (USV) … 続きを読む
Active Listener: Continuous Generation of Listener’s Head Motion Response in Dyadic Interactions
要約 二項音声対話の重要な要素は、対話者の発話に対する聞き手の反応を反映する頭の … 続きを読む