-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.IR」カテゴリーアーカイブ
Multi-Modal Cross-Domain Alignment Network for Video Moment Retrieval
要約 マルチメディア情報検索でますます一般的なタスクとして、ビデオ モーメント検 … 続きを読む
Boost CTR Prediction for New Advertisements via Modeling Visual Content
要約 既存の広告のクリック率 (CTR) 予測モデルは、主に行動 ID 機能に依 … 続きを読む
CONE: An Efficient COarse-to-fiNE Alignment Framework for Long Video Temporal Grounding
要約 ビデオ テンポラル グラウンディング (VTG) のターゲットは、自然言語 … 続きを読む
Transformers and CNNs both Beat Humans on SBIR
要約 スケッチベースの画像検索 (SBIR) は、手書きスケッチ クエリのセマン … 続きを読む
MetaNetwork: A Task-agnostic Network Parameters Generation Framework for Improving Device Model Generalization
要約 モバイル デバイスに機械学習モデルを展開することへの注目が高まっています。 … 続きを読む
Confidence-Aware Active Feedback for Interactive Instance Search
要約 オンライン関連性フィードバック(RF)は不完全なランキング結果をさらに洗練 … 続きを読む
Hierarchical Local-Global Transformer for Temporal Sentence Grounding
要約 この論文では、特定の文のクエリに従って、トリミングされていないビデオの特定 … 続きを読む
Compound virtual screening by learning-to-rank with gradient boosting decision tree and enrichment-based cumulative gain
要約 Learning-to-rank は、情報検索で広く使用されている機械学習 … 続きを読む
Late multimodal fusion for image and audio music transcription
要約 音楽ソースを構造化されたデジタル形式に変換する音楽のトランスクリプションは … 続きを読む
Semi-supervised Human Pose Estimation in Art-historical Images
要約 非言語コミュニケーションの言語としてのジェスチャーは、17 世紀から理論的 … 続きを読む