-
最近の投稿
- Open-Vocabulary Action Localization with Iterative Visual Prompting
- Patterned Structure Muscle : Arbitrary Shaped Wire-driven Artificial Muscle Utilizing Anisotropic Flexible Structure for Musculoskeletal Robots
- The Power of Input: Benchmarking Zero-Shot Sim-To-Real Transfer of Reinforcement Learning Control Policies for Quadrotor Control
- PokeFlex: A Real-World Dataset of Deformable Objects for Robotics
- Toward a Better Understanding of Robot Energy Consumption in Agroecological Applications
-
最近のコメント
表示できるコメントはありません。 cs.AI (27918) cs.CL (21095) cs.CR (2183) cs.CV (34618) cs.LG (32650) cs.RO (16022) cs.SY (2484) eess.IV (4238) eess.SY (2478) stat.ML (4372)
月別アーカイブ: 2023年1月
Learning Trajectory-Word Alignments for Video-Language Tasks
要約 画像言語BERT(IL-BERT)や動画言語BERT(VDL-BERT)で … 続きを読む
カテゴリー: cs.CV
Learning Trajectory-Word Alignments for Video-Language Tasks はコメントを受け付けていません
Adaptively Clustering Neighbor Elements for Image Captioning
要約 我々は、キャプションを生成するための新しいグローバル-ローカル変換器である … 続きを読む
カテゴリー: cs.CV
Adaptively Clustering Neighbor Elements for Image Captioning はコメントを受け付けていません
High-level semantic feature matters few-shot unsupervised domain adaptation
要約 FS-UDA (few-shot unsupervised domain … 続きを読む
カテゴリー: cs.CV
High-level semantic feature matters few-shot unsupervised domain adaptation はコメントを受け付けていません
CAT: LoCalization and IdentificAtion Cascade Detection Transformer for Open-World Object Detection
要約 オープンワールドオブジェクト検出(OWOD)は、より一般的かつ挑戦的な目標 … 続きを読む
カテゴリー: cs.CV
CAT: LoCalization and IdentificAtion Cascade Detection Transformer for Open-World Object Detection はコメントを受け付けていません
Attention-Aware Anime Line Drawing Colorization
要約 近年、アニメの線画の自動着色は、アニメ産業に多大な利益をもたらすことから注 … 続きを読む
Swin MAE: Masked Autoencoders for Small Datasets
要約 医用画像解析における深層学習モデルの開発は、大規模かつ十分に注釈されたデー … 続きを読む
WPPNets and WPPFlows: The Power of Wasserstein Patch Priors for Superresolution
要約 画像全体の代わりに画像パッチを利用することは,画像処理における様々な問題に … 続きを読む
Neural Distributed Image Compression with Cross-Attention Feature Alignment
要約 情報理論における分散ソース符号化問題の特殊例として、相関のあるものがデコー … 続きを読む
CenterLoc3D: Monocular 3D Vehicle Localization Network for Roadside Surveillance Cameras
要約 単眼3D車両定位は、高度道路交通システム(ITS)や協調型車両インフラシス … 続きを読む
Expressive Speech-driven Facial Animation with controllable emotions
要約 リアルなフェイシャルアニメーションを生成することが求められていますが、その … 続きを読む
カテゴリー: cs.CV
Expressive Speech-driven Facial Animation with controllable emotions はコメントを受け付けていません