-
最近の投稿
- Multimodal Active Measurement for Human Mesh Recovery in Close Proximity
- An Algorithm for Distributed Computation of Reachable Sets for Multi-Agent Systems
- Meta-Learning Augmented MPC for Disturbance-Aware Motion Planning and Control of Quadrotors
- Solving Multi-Goal Robotic Tasks with Decision Transformer
- Context-Aware Command Understanding for Tabletop Scenarios
-
最近のコメント
表示できるコメントはありません。 cs.AI (27848) cs.CL (21045) cs.CR (2180) cs.CV (34554) cs.LG (32592) cs.RO (15968) cs.SY (2478) eess.IV (4238) eess.SY (2472) stat.ML (4364)
「cs.MM」カテゴリーアーカイブ
MACO: A Modality Adversarial and Contrastive Framework for Modality-missing Multi-modal Knowledge Graph Completion
要約 近年、マルチモーダルナレッジグラフ補完 (MMKGC) が大幅に進歩しまし … 続きを読む
Temporal Sentence Grounding in Streaming Videos
要約 この論文は、ストリーミング ビデオにおける時間的センテンス グラウンディン … 続きを読む
CTP: Towards Vision-Language Continual Pretraining via Compatible Momentum Contrast and Topology Preservation
要約 Vision-Language Pretraining (VLP) は、大 … 続きを読む
SLIC: Large Receptive Field Learning with Self-Conditioned Adaptability for Learned Image Compression
要約 最近、トランスフォーマーは、圧縮などのビジョンタスクにおいて CNN の代 … 続きを読む
Jurassic World Remake: Bringing Ancient Fossils Back to Life via Zero-Shot Long Image-to-Image Translation
要約 自然言語からターゲットドメインを深く理解することで、私たちは大きなドメイン … 続きを読む
Towards Unified Text-based Person Retrieval: A Large-scale Multi-Attribute and Language Search Benchmark
要約 この論文では、MALS と呼ばれる、テキストベースの人物検索のための大規模 … 続きを読む
Deep Learning for Diverse Data Types Steganalysis: A Review
要約 ステガノグラフィーとステガナリシスは、情報セキュリティ分野の 2 つの相互 … 続きを読む
Towards Unified Text-based Person Retrieval: A Large-scale Multi-Attribute and Language Search Benchmark
要約 この論文では、MALS と呼ばれる、テキストベースの人物検索のための大規模 … 続きを読む
Versatile Face Animator: Driving Arbitrary 3D Facial Avatar in RGBD Space
要約 リアルな 3D フェイシャル アニメーションの作成は、映画制作やゲーム業界 … 続きを読む