-
最近の投稿
- Open-Vocabulary Action Localization with Iterative Visual Prompting
- Patterned Structure Muscle : Arbitrary Shaped Wire-driven Artificial Muscle Utilizing Anisotropic Flexible Structure for Musculoskeletal Robots
- The Power of Input: Benchmarking Zero-Shot Sim-To-Real Transfer of Reinforcement Learning Control Policies for Quadrotor Control
- PokeFlex: A Real-World Dataset of Deformable Objects for Robotics
- Toward a Better Understanding of Robot Energy Consumption in Agroecological Applications
-
最近のコメント
表示できるコメントはありません。 cs.AI (27918) cs.CL (21095) cs.CR (2183) cs.CV (34618) cs.LG (32650) cs.RO (16022) cs.SY (2484) eess.IV (4238) eess.SY (2478) stat.ML (4372)
「cs.MM」カテゴリーアーカイブ
TOT: Topology-Aware Optimal Transport For Multimodal Hate Detection
要約 タイトル:多様な憎悪検知のためのトポロジー認識最適輸送 要約: ̵ … 続きを読む
Robust and Efficient Memory Network for Video Object Segmentation
要約 タイトル:ビデオオブジェクトセグメンテーションのための堅牢かつ効率的なメモ … 続きを読む
MMC: Multi-Modal Colorization of Images using Textual Descriptions
要約 タイトル:テキスト記述を用いたマルチモーダル画像着色(MMC: Multi … 続きを読む
GRIG: Few-Shot Generative Residual Image Inpainting
要約 タイトル:GRIG: Few-Shot Generative Residu … 続きを読む
A Plug-and-Play Defensive Perturbation for Copyright Protection of DNN-based Applications
要約 タイトル:AIアプリケーションの著作権保護のためのプラグアンドプレイ防御的 … 続きを読む
Rethinking Benchmarks for Cross-modal Image-text Retrieval
要約 タイトル:Cross-modal Image-text Retrieval … 続きを読む
FindVehicle and VehicleFinder: A NER dataset for natural language-based vehicle retrieval and a keyword-based cross-modal vehicle retrieval system
要約 タイトル:自然言語に基づく車両検索のためのNERデータセットとキーワードベ … 続きを読む
Learning CLIP Guided Visual-Text Fusion Transformer for Video-based Pedestrian Attribute Recognition
要約 タイトル:ビデオをベースとした歩行属性認識のためのCLIPガイドの視覚-テ … 続きを読む
Promptify: Text-to-Image Generation through Interactive Prompt Exploration with Large Language Models
要約 タイトル:Promptify:大規模言語モデルを用いたインタラクティブなプ … 続きを読む
SP-BatikGAN: An Efficient Generative Adversarial Network for Symmetric Pattern Generation
要約 タイトル: SP-BatikGAN: 対称的なパターン生成のための効率的な … 続きを読む