-
最近の投稿
- Agent-Based Emulation for Deploying Robot Swarm Behaviors
- Automated Planning Domain Inference for Task and Motion Planning
- Tactile Displays Driven by Projected Light
- Caging in Time: A Framework for Robust Object Manipulation under Uncertainties and Limited Robot Perception
- Implicit Contact Diffuser: Sequential Contact Reasoning with Latent Point Cloud Diffusion
-
最近のコメント
表示できるコメントはありません。 cs.AI (28464) cs.CL (21516) cs.CR (2224) cs.CV (35088) cs.LG (33220) cs.RO (16420) cs.SY (2528) eess.IV (4274) eess.SY (2522) stat.ML (4457)
「cs.IR」カテゴリーアーカイブ
Content-Based Search for Deep Generative Models
要約 学習済み生成モデルの増加により、ユーザが存在する全てのモデルを完全に認識す … 続きを読む
On Background Bias in Deep Metric Learning
要約 Deep Metric Learningは、入力画像を低次元の埋め込み空間 … 続きを読む
Weighted Contrastive Hashing
要約 教師なしハッシュの開発は、最近人気のある対照的学習パラダイムによって進めら … 続きを読む
Text-Adaptive Multiple Visual Prototype Matching for Video-Text Retrieval
要約 Web でのビデオの急速な出現により、ビデオとテキスト間のクロスモーダル検 … 続きを読む
Improving Document Image Understanding with Reinforcement Finetuning
要約 成功した人工知能システムでは、多くの場合、文書画像から情報を抽出するために … 続きを読む
Unsupervised Hashing with Semantic Concept Mining
要約 最近、教師なし画像検索のパフォーマンスを向上させるために、事前トレーニング … 続きを読む
Marine Video Kit: A New Marine Video Dataset for Content-based Analysis and Retrieval
要約 異常なドメイン固有のビデオ コレクションの効果的な分析は、最先端の汎用モデ … 続きを読む
Multi-Modal Cross-Domain Alignment Network for Video Moment Retrieval
要約 マルチメディア情報検索でますます一般的なタスクとして、ビデオ モーメント検 … 続きを読む
Boost CTR Prediction for New Advertisements via Modeling Visual Content
要約 既存の広告のクリック率 (CTR) 予測モデルは、主に行動 ID 機能に依 … 続きを読む
CONE: An Efficient COarse-to-fiNE Alignment Framework for Long Video Temporal Grounding
要約 ビデオ テンポラル グラウンディング (VTG) のターゲットは、自然言語 … 続きを読む