-
最近の投稿
- On the Feedback Law in Stochastic Optimal Nonlinear Control
- Open-Vocabulary Action Localization with Iterative Visual Prompting
- Patterned Structure Muscle : Arbitrary Shaped Wire-driven Artificial Muscle Utilizing Anisotropic Flexible Structure for Musculoskeletal Robots
- The Power of Input: Benchmarking Zero-Shot Sim-To-Real Transfer of Reinforcement Learning Control Policies for Quadrotor Control
- PokeFlex: A Real-World Dataset of Deformable Objects for Robotics
-
最近のコメント
表示できるコメントはありません。 cs.AI (27918) cs.CL (21095) cs.CR (2183) cs.CV (34618) cs.LG (32650) cs.RO (16023) cs.SY (2485) eess.IV (4238) eess.SY (2479) stat.ML (4372)
「cs.MM」カテゴリーアーカイブ
Cross Modal Compression: Towards Human-comprehensible Semantic Compression
要約 従来の画像・映像圧縮は、信号の忠実度をできるだけ高くして、伝送・保存コスト … 続きを読む
Geometry Aligned Variational Transformer for Image-conditioned Layout Generation
要約 レイアウト生成は、物体定位と美的評価の両方の課題を兼ね備えたコンピュータビ … 続きを読む
Confidence-Aware Active Feedback for Interactive Instance Search
要約 オンライン関連性フィードバック(RF)は不完全なランキング結果をさらに洗練 … 続きを読む
GSRFormer: Grounded Situation Recognition Transformer with Alternate Semantic Attention Refinement
要約 Grounded Situation Recognition (GSR) … 続きを読む
EViT: Privacy-Preserving Image Retrieval via Encrypted Vision Transformer in Cloud Computing
要約 画像検索システムは、ユーザーが大量の画像をリアルタイムで参照および検索する … 続きを読む
Hierarchical Local-Global Transformer for Temporal Sentence Grounding
要約 この論文では、特定の文のクエリに従って、トリミングされていないビデオの特定 … 続きを読む
PanorAMS: Automatic Annotation for Detecting Objects in Urban Context
要約 地理参照されたパノラマ画像の大規模なコレクションは、世界中の都市で自由に利 … 続きを読む
PanorAMS: Automatic Annotation for Detecting Objects in Urban Context
要約 地理参照されたパノラマ画像の大規模なコレクションは、世界中の都市で自由に利 … 続きを読む
Deep Decomposition and Bilinear Pooling Network for Blind Night-Time Image Quality Evaluation
要約 元の参照情報なしで画質を正確に予測することを目的としたブラインド画質評価 … 続きを読む
Partially Relevant Video Retrieval
要約 テキストからビデオへの検索 (T2VR) の現在の方法は、MSVD、MSR … 続きを読む