-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.MM」カテゴリーアーカイブ
Multimodal Analogical Reasoning over Knowledge Graphs
要約 類推は人間の認知の基本であり、さまざまな分野で重要な位置を占めています。 … 続きを読む
Rate-Perception Optimized Preprocessing for Video Coding
要約 過去数十年で、従来のビデオ コーデックや学習ベースのビデオ コーデックなど … 続きを読む
LDMIC: Learning-based Distributed Multi-view Image Coding
要約 マルチビュー画像圧縮は、3D 関連のアプリケーションで重要な役割を果たしま … 続きを読む
AccDecoder: Accelerated Decoding for Neural-enhanced Video Analytics
要約 ビデオ ストリームの品質は、ニューラル ネットワーク ベースのビデオ分析に … 続きを読む
Side Eye: Characterizing the Limits of POV Acoustic Eavesdropping from Smartphone Cameras with Rolling Shutters and Movable Lenses
要約 私たちの研究では、スマートフォンのカメラに広く見られるローリング シャッタ … 続きを読む
Generative Colorization of Structured Mobile Web Pages
要約 色は Web ページの重要なデザイン要素であり、閲覧者の感情や Web サ … 続きを読む
SoundSpaces 2.0: A Simulation Platform for Visual-Acoustic Learning
要約 3D 環境向けのオンザフライ ジオメトリベースのオーディオ レンダリングの … 続きを読む
SgVA-CLIP: Semantic-guided Visual Adapting of Vision-Language Models for Few-shot Image Classification
要約 少数ショット学習では大きな進歩がありましたが、既存の少数ショット画像分類方 … 続きを読む
AccDecoder: Accelerated Decoding for Neural-enhanced Video Analytics
要約 ビデオ ストリームの品質は、ニューラル ネットワーク ベースのビデオ分析に … 続きを読む
Sharp Eyes: A Salient Object Detector Working The Same Way as Human Visual Characteristics
要約 現在の方法では、マルチレベルの機能を集約するか、エッジとスケルトンを導入し … 続きを読む