-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.MM」カテゴリーアーカイブ
VICTOR: Visual Incompatibility Detection with Transformers and Fashion-specific contrastive pre-training
要約 ファッションの着こなしが美的であるとみなされるためには、それを構成する衣服 … 続きを読む
Frame-Subtitle Self-Supervision for Multi-Modal Video Question Answering
要約 マルチモーダルビデオ質問応答は、正解を予測し、質問に関連する時間的境界を局 … 続きを読む
Saliency-based Multiple Region of Interest Detection from a Single 360° image
要約 360度画像は、カメラ周辺の全方位的な視覚情報を含んでいるため、情報量が豊 … 続きを読む
CorrI2P: Deep Image-to-Point Cloud Registration via Dense Correspondence
要約 本論文では、2次元画像を3次元点群に位置決めするための重要なステップは、両 … 続きを読む
DM$^2$S$^2$: Deep Multi-Modal Sequence Sets with Hierarchical Modality Attention
要約 デジタル広告や電子商取引などの様々なウェブアプリケーションにおいて、マルチ … 続きを読む
Identification of Small Objects in Satellite Image Benchmarks
要約 近年の航空画像へのアクセスと量の増加、計算能力の向上、およびアプリケーショ … 続きを読む
Cross Modal Compression: Towards Human-comprehensible Semantic Compression
要約 従来の画像・映像圧縮は、信号の忠実度をできるだけ高くして、伝送・保存コスト … 続きを読む
Geometry Aligned Variational Transformer for Image-conditioned Layout Generation
要約 レイアウト生成は、物体定位と美的評価の両方の課題を兼ね備えたコンピュータビ … 続きを読む
Confidence-Aware Active Feedback for Interactive Instance Search
要約 オンライン関連性フィードバック(RF)は不完全なランキング結果をさらに洗練 … 続きを読む