-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.MM」カテゴリーアーカイブ
A Plug-and-Play Defensive Perturbation for Copyright Protection of DNN-based Applications
要約 タイトル:AIアプリケーションの著作権保護のためのプラグアンドプレイ防御的 … 続きを読む
Rethinking Benchmarks for Cross-modal Image-text Retrieval
要約 タイトル:Cross-modal Image-text Retrieval … 続きを読む
FindVehicle and VehicleFinder: A NER dataset for natural language-based vehicle retrieval and a keyword-based cross-modal vehicle retrieval system
要約 タイトル:自然言語に基づく車両検索のためのNERデータセットとキーワードベ … 続きを読む
Learning CLIP Guided Visual-Text Fusion Transformer for Video-based Pedestrian Attribute Recognition
要約 タイトル:ビデオをベースとした歩行属性認識のためのCLIPガイドの視覚-テ … 続きを読む
Promptify: Text-to-Image Generation through Interactive Prompt Exploration with Large Language Models
要約 タイトル:Promptify:大規模言語モデルを用いたインタラクティブなプ … 続きを読む
SP-BatikGAN: An Efficient Generative Adversarial Network for Symmetric Pattern Generation
要約 タイトル: SP-BatikGAN: 対称的なパターン生成のための効率的な … 続きを読む
SLIC: Self-Conditioned Adaptive Transform with Large-Scale Receptive Fields for Learned Image Compression
要約 タイトル:自己条件付き適応変換と大規模受容野を持つ学習済み画像圧縮のSLI … 続きを読む
MMANet: Margin-aware Distillation and Modality-aware Regularization for Incomplete Multimodal Learning
要約 タイトル:MMANet:不完全なマルチモーダル学習のためのマージン・アウェ … 続きを読む
FSVVD: A Dataset of Full Scene Volumetric Video
要約 【タイトル】FSVVD:フルシーンボリューメトリックビデオのデータセット … 続きを読む