-
最近の投稿
- Open-Vocabulary Action Localization with Iterative Visual Prompting
- Patterned Structure Muscle : Arbitrary Shaped Wire-driven Artificial Muscle Utilizing Anisotropic Flexible Structure for Musculoskeletal Robots
- The Power of Input: Benchmarking Zero-Shot Sim-To-Real Transfer of Reinforcement Learning Control Policies for Quadrotor Control
- PokeFlex: A Real-World Dataset of Deformable Objects for Robotics
- Toward a Better Understanding of Robot Energy Consumption in Agroecological Applications
-
最近のコメント
表示できるコメントはありません。 cs.AI (27918) cs.CL (21095) cs.CR (2183) cs.CV (34618) cs.LG (32650) cs.RO (16022) cs.SY (2484) eess.IV (4238) eess.SY (2478) stat.ML (4372)
「cs.MM」カテゴリーアーカイブ
On the Importance of Noise Scheduling for Diffusion Models
要約 拡散生成モデルのノイズを除去するためのノイズスケジューリング戦略の効果を経 … 続きを読む
Protein Representation Learning via Knowledge Enhanced Primary Structure Modeling
要約 タンパク質表現学習は、主に言語モデル (LM) の目覚ましい発展の恩恵を受 … 続きを読む
Deepfake Detection: A Comprehensive Study from the Reliability Perspective
要約 インターネット上で流通しているディープフェイクの合成素材は、政治家、有名人 … 続きを読む
3D-VFD: A Victim-free Detector against 3D Adversarial Point Clouds
要約 点群を使用する 3D ディープ モデルは、コンピューター ビジョンで優れた … 続きを読む
VoLTA: Vision-Language Transformer with Weakly-Supervised Local-Feature Alignment
要約 ビジョン言語事前トレーニング (VLP) は、最近、さまざまなユニモーダル … 続きを読む
Towards Robust Neural Image Compression: Adversarial Attack and Model Finetuning
要約 ディープ ニューラル ネットワークに基づく画像圧縮は、広く研究されています … 続きを読む
DiffFaceSketch: High-Fidelity Face Image Synthesis with Sketch-Guided Latent Diffusion Model
要約 モノクロ スケッチから顔画像を合成することは、画像から画像への変換の分野で … 続きを読む
Zero3D: Semantic-Driven Multi-Category 3D Shape Generation
要約 セマンティック主導の 3D 形状生成は、テキストに基づいて調整された 3D … 続きを読む
LaT: Latent Translation with Cycle-Consistency for Video-Text Retrieval
要約 ビデオテキスト検索は、クロスモーダル表現学習問題のクラスであり、その目標は … 続きを読む
Video compression dataset and benchmark of learning-based video-quality metrics
要約 映像品質測定は、映像処理における重要なタスクである。現在、AV1、VVC、 … 続きを読む