-
最近の投稿
- Open-Vocabulary Action Localization with Iterative Visual Prompting
- Patterned Structure Muscle : Arbitrary Shaped Wire-driven Artificial Muscle Utilizing Anisotropic Flexible Structure for Musculoskeletal Robots
- The Power of Input: Benchmarking Zero-Shot Sim-To-Real Transfer of Reinforcement Learning Control Policies for Quadrotor Control
- PokeFlex: A Real-World Dataset of Deformable Objects for Robotics
- Toward a Better Understanding of Robot Energy Consumption in Agroecological Applications
-
最近のコメント
表示できるコメントはありません。 cs.AI (27918) cs.CL (21095) cs.CR (2183) cs.CV (34618) cs.LG (32650) cs.RO (16022) cs.SY (2484) eess.IV (4238) eess.SY (2478) stat.ML (4372)
「cs.MM」カテゴリーアーカイブ
SoundSpaces 2.0: A Simulation Platform for Visual-Acoustic Learning
要約 3D 環境向けのオンザフライ ジオメトリベースのオーディオ レンダリングの … 続きを読む
SgVA-CLIP: Semantic-guided Visual Adapting of Vision-Language Models for Few-shot Image Classification
要約 少数ショット学習では大きな進歩がありましたが、既存の少数ショット画像分類方 … 続きを読む
AccDecoder: Accelerated Decoding for Neural-enhanced Video Analytics
要約 ビデオ ストリームの品質は、ニューラル ネットワーク ベースのビデオ分析に … 続きを読む
Sharp Eyes: A Salient Object Detector Working The Same Way as Human Visual Characteristics
要約 現在の方法では、マルチレベルの機能を集約するか、エッジとスケルトンを導入し … 続きを読む
Reduced-Reference Quality Assessment of Point Clouds via Content-Oriented Saliency Projection
要約 多くの高密度 3D 点群が、従来の画像やビデオの代わりに視覚オブジェクトを … 続きを読む
Semi-Supervised Semantic Segmentation Methods for UW-OCTA Diabetic Retinopathy Grade Assessment
要約 糖尿病の人は、健康な人よりも糖尿病性網膜症 (DR) を発症する可能性が高 … 続きを読む
Scene-centric vs. Object-centric Image-Text Cross-modal Retrieval: A Reproducibility Study
要約 クロスモーダル検索 (CMR) へのほとんどのアプローチは、オブジェクト中 … 続きを読む
A Dietary Nutrition-aided Healthcare Platform via Effective Food Recognition on a Localized Singaporean Food Dataset
要約 ローカライズされた食品データセットは、国の特別な料理を明らかにして人々の食 … 続きを読む
Vision Transformers Are Good Mask Auto-Labelers
要約 我々は、ボックスアノテーションのみを用いたインスタンスセグメンテーションの … 続きを読む
Text2Poster: Laying out Stylized Texts on Retrieved Images
要約 ポスターの生成は様々な用途で重要なタスクですが、多くの場合、時間がかかり、 … 続きを読む