-
最近の投稿
- On the Feedback Law in Stochastic Optimal Nonlinear Control
- Open-Vocabulary Action Localization with Iterative Visual Prompting
- Patterned Structure Muscle : Arbitrary Shaped Wire-driven Artificial Muscle Utilizing Anisotropic Flexible Structure for Musculoskeletal Robots
- The Power of Input: Benchmarking Zero-Shot Sim-To-Real Transfer of Reinforcement Learning Control Policies for Quadrotor Control
- PokeFlex: A Real-World Dataset of Deformable Objects for Robotics
-
最近のコメント
表示できるコメントはありません。 cs.AI (27918) cs.CL (21095) cs.CR (2183) cs.CV (34618) cs.LG (32650) cs.RO (16023) cs.SY (2485) eess.IV (4238) eess.SY (2479) stat.ML (4372)
「cs.MM」カテゴリーアーカイブ
QuantArt: Quantizing Image Style Transfer Towards High Visual Fidelity
要約 既存のスタイル転送アルゴリズムのメカニズムは、ハイブリッド損失関数を最小化 … 続きを読む
MAViL: Masked Audio-Video Learners
要約 オーディオビジュアル表現をトレーニングするために、Masked Audio … 続きを読む
Overview of The MediaEval 2022 Predicting Video Memorability Task
要約 このホワイト ペーパーでは、MediaEval2022 の一部として、ビデ … 続きを読む
Memories are One-to-Many Mapping Alleviators in Talking Face Generation
要約 話す顔の生成は、入力オーディオによって駆動される対象人物の写真のようにリア … 続きを読む
Video-Text Modeling with Zero-Shot Transfer from Contrastive Captioners
要約 この作業では、オープン語彙ビデオ分類、テキストからビデオへの検索、ビデオ … 続きを読む
Memories are One-to-Many Mapping Alleviators in Talking Face Generation
要約 話す顔の生成は、入力オーディオによって駆動される対象人物の写真のようにリア … 続きを読む
iQuery: Instruments as Queries for Audio-Visual Sound Separation
要約 現在のオーディオとビジュアルの分離方法は、オーディオ エンコーダー/デコー … 続きを読む
iQuery: Instruments as Queries for Audio-Visual Sound Separation
要約 現在のオーディオとビジュアルの分離方法は、オーディオ エンコーダー/デコー … 続きを読む
Semantic-Conditional Diffusion Networks for Image Captioning
要約 テキストから画像への生成に関する最近の進歩により、強力な生成モデルとして機 … 続きを読む