-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.MM」カテゴリーアーカイブ
Trajectory Approximation of Video Based on Phase Correlation for Forward Facing Camera
要約 このペーパーでは、視覚的なオドメトリを活用して、GPS が拒否された環境で … 続きを読む
FusionFrames: Efficient Architectural Aspects for Text-to-Video Generation Pipeline
要約 マルチメディア生成アプローチは、人工知能研究において重要な位置を占めていま … 続きを読む
A Challenger to GPT-4V? Early Explorations of Gemini in Visual Expertise
要約 OpenAI の GPT-4V(ision) など、マルチモーダル大規模言 … 続きを読む
Learning from Mistakes: Self-Regularizing Hierarchical Representations in Point Cloud Semantic Segmentation
要約 自律型ロボット技術の最近の進歩により、正確な環境分析の必要性が高まっていま … 続きを読む
A Challenger to GPT-4V? Early Explorations of Gemini in Visual Expertise
要約 OpenAI の GPT-4V(ision) など、マルチモーダル大規模言 … 続きを読む
Debiasing Multimodal Sarcasm Detection with Contrastive Learning
要約 既存の研究によって達成された賞賛に値する成果にもかかわらず、一般的なマルチ … 続きを読む
Debiasing Multimodal Sarcasm Detection with Contrastive Learning
要約 既存の研究によって達成された賞賛に値する成果にもかかわらず、一般的なマルチ … 続きを読む
Part Representation Learning with Teacher-Student Decoder for Occluded Person Re-identification
要約 遮蔽された人物の再識別 (ReID) は、遮蔽障害と不完全なターゲット情報 … 続きを読む
Learning Language-guided Adaptive Hyper-modality Representation for Multimodal Sentiment Analysis
要約 マルチモーダル感情分析 (MSA) は、複数のソース (言語、ビデオ、音声 … 続きを読む