-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.IR」カテゴリーアーカイブ
Intra-class Adaptive Augmentation with Neighbor Correction for Deep Metric Learning
要約 ディープ メトリック ラーニングは、意味的に類似したサンプルが近くにあり、 … 続きを読む
Contrastive Masked Autoencoders for Self-Supervised Video Hashing
要約 Self-Supervised Video Hashing (SSVH) … 続きを読む
Informative Sample-Aware Proxy for Deep Metric Learning
要約 さまざまな教師あり深層メトリック学習法の中で、プロキシベースのアプローチは … 続きを読む
Multi-Modal Cross-Domain Alignment Network for Video Moment Retrieval
要約 マルチメディア情報検索でますます一般的なタスクとして、ビデオ モーメント検 … 続きを読む
On Analyzing the Role of Image for Visual-enhanced Relation Extraction
要約 マルチモーダルな関係抽出は、ナレッジ グラフの構築に不可欠なタスクです。 … 続きを読む
Tables to LaTeX: structure and content extraction from scientific tables
要約 科学文書には、重要な情報を簡潔にまとめた表が含まれています。 PDF 研究 … 続きを読む
FedVMR: A New Federated Learning method for Video Moment Retrieval
要約 大きな成功を収めたにもかかわらず、既存のビデオ モーメント検索 (VMR) … 続きを読む
Structuring User-Generated Content on Social Media with Multimodal Aspect-Based Sentiment Analysis
要約 人々は自分の意見や経験をソーシャル メディアに投稿し、エンド ユーザーの感 … 続きを読む
Multimodal Transformer Distillation for Audio-Visual Synchronization
要約 視聴覚同期は、ビデオ内の口の動きと音声が同期しているかどうかを判断すること … 続きを読む