-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.MM」カテゴリーアーカイブ
AV-SUPERB: A Multi-Task Evaluation Benchmark for Audio-Visual Representation Models
要約 視聴覚表現学習は、聴覚情報と視覚情報の相関関係を利用して、人間のような知覚 … 続きを読む
Hybrid Transformer with Multi-level Fusion for Multimodal Knowledge Graph Completion
要約 ビジュアルテキストの事実知識を整理するマルチモーダル ナレッジ グラフ ( … 続きを読む
Beyond Domain Gap: Exploiting Subjectivity in Sketch-Based Person Retrieval
要約 個人の再識別 (re-ID) には、高密度に分散されたカメラが必要です。 … 続きを読む
Spoken Humanoid Embodied Conversational Agents in Mobile Serious Games: A Usability Assessment
要約 この論文では、音声ヒューマノイド肉体型会話エージェント (HECAs) が … 続きを読む
Usability Evaluation of Spoken Humanoid Embodied Conversational Agents in Mobile Serious Games
要約 この論文では、音声ヒューマノイド肉体型会話エージェント (HECAs) が … 続きを読む
A Survey on Interpretable Cross-modal Reasoning
要約 近年、さまざまなモダリティを超えて理解および推論するプロセスであるクロスモ … 続きを読む
Mitigating Hallucination in Large Multi-Modal Models via Robust Instruction Tuning
要約 マルチモーダル タスクにおける有望な進歩にもかかわらず、現在の大規模マルチ … 続きを読む
GEmo-CLAP: Gender-Attribute-Enhanced Contrastive Language-Audio Pretraining for Accurate Speech Emotion Recognition
要約 対照的クロスモダリティ事前トレーニングは、最近さまざまな分野で目覚ましい成 … 続きを読む
Gpachov at CheckThat! 2023: A Diverse Multi-Approach Ensemble for Subjectivity Detection in News Articles
要約 ソーシャル ネットワークの普及により、主観的で誤解を招く、さらには誤った情 … 続きを読む