-
最近の投稿
- Open-Vocabulary Action Localization with Iterative Visual Prompting
- Patterned Structure Muscle : Arbitrary Shaped Wire-driven Artificial Muscle Utilizing Anisotropic Flexible Structure for Musculoskeletal Robots
- The Power of Input: Benchmarking Zero-Shot Sim-To-Real Transfer of Reinforcement Learning Control Policies for Quadrotor Control
- PokeFlex: A Real-World Dataset of Deformable Objects for Robotics
- Toward a Better Understanding of Robot Energy Consumption in Agroecological Applications
-
最近のコメント
表示できるコメントはありません。 cs.AI (27918) cs.CL (21095) cs.CR (2183) cs.CV (34618) cs.LG (32650) cs.RO (16022) cs.SY (2484) eess.IV (4238) eess.SY (2478) stat.ML (4372)
「cs.MM」カテゴリーアーカイブ
Knowledge-based Multimodal Music Similarity
要約 音楽の類似性は、音楽検索、推奨システム、および音楽分析にとって重要な側面で … 続きを読む
RS5M: A Large Scale Vision-Language Dataset for Remote Sensing Vision-Language Foundation Model
要約 広範な画像とテキストのペアデータを利用した事前トレーニング済みの視覚言語基 … 続きを読む
MSVD-Indonesian: A Benchmark for Multimodal Video-Text Tasks in Indonesian
要約 ビデオおよびテキスト データのマルチモーダル学習は、テキストからビデオへの … 続きを読む
Low-complexity Multidimensional DCT Approximations
要約 この論文では、複雑さの低い多次元離散コサイン変換 (DCT) 近似を紹介し … 続きを読む
GEmo-CLAP: Gender-Attribute-Enhanced Contrastive Language-Audio Pretraining for Speech Emotion Recognition
要約 対照学習ベースの事前トレーニング方法は、最近、さまざまな分野で目覚ましい成 … 続きを読む
Inspire creativity with ORIBA: Transform Artists’ Original Characters into Chatbots through Large Language Model
要約 この研究は、イラストレーターがオリジナルのキャラクター (OC) を体現す … 続きを読む
カテゴリー: 14J26 (Secondary), 14J60 (Primary) 14F05, cs.AI, cs.HC, cs.MM, F.2.2
Inspire creativity with ORIBA: Transform Artists’ Original Characters into Chatbots through Large Language Model はコメントを受け付けていません
COSA: Concatenated Sample Pretrained Vision-Language Foundation Model
要約 ビデオテキストトレーニングコーパスの規模と品質が限られているため、ほとんど … 続きを読む
GEmo-CLAP: Gender-Attribute-Enhanced Contrastive Language-Audio Pretraining for Speech Emotion Recognition
要約 Contrastive Language-Audio Pretrainin … 続きを読む
Enhanced Multimodal Representation Learning with Cross-modal KD
要約 この論文では、クロスモーダル知識蒸留 (KD) を通じてマルチモーダル表現 … 続きを読む
Localization of Just Noticeable Difference for Image Compression
要約 可感差異 (JND) は、人が検出できる刺激間の最小差異です。 特定の参照 … 続きを読む