-
最近の投稿
- Multimodal Active Measurement for Human Mesh Recovery in Close Proximity
- An Algorithm for Distributed Computation of Reachable Sets for Multi-Agent Systems
- Meta-Learning Augmented MPC for Disturbance-Aware Motion Planning and Control of Quadrotors
- Solving Multi-Goal Robotic Tasks with Decision Transformer
- Context-Aware Command Understanding for Tabletop Scenarios
-
最近のコメント
表示できるコメントはありません。 cs.AI (27848) cs.CL (21045) cs.CR (2180) cs.CV (34554) cs.LG (32592) cs.RO (15968) cs.SY (2478) eess.IV (4238) eess.SY (2472) stat.ML (4364)
「cs.MM」カテゴリーアーカイブ
Audio-Visual Glance Network for Efficient Video Recognition
要約 ディープラーニングはビデオ理解タスクにおいて大幅な進歩を遂げましたが、クリ … 続きを読む
RLIPv2: Fast Scaling of Relational Language-Image Pre-training
要約 リレーショナル言語イメージ事前トレーニング (RLIP) は、ビジョン表現 … 続きを読む
A Shift In Artistic Practices through Artificial Intelligence
要約 人工知能モデルによって生成されたコンテンツの爆発的な増加により、芸術、音楽 … 続きを読む
Language-Guided Diffusion Model for Visual Grounding
要約 ビジュアル グラウンディング (VG) タスクには、提供された言語フレーズ … 続きを読む
KeyPosS: Plug-and-Play Facial Landmark Detection through GPS-Inspired True-Range Multilateration
要約 顔分析の分野では、顔認識や表情分析からアニメーションに至るまで、さまざまな … 続きを読む
PoSynDA: Multi-Hypothesis Pose Synthesis Domain Adaptation for Robust 3D Human Pose Estimation
要約 現在の 3D 人間の姿勢推定器は、ターゲット ドメインのトレーニング セッ … 続きを読む
Audiovisual Moments in Time: A Large-Scale Annotated Dataset of Audiovisual Actions
要約 私たちは、オーディオビジュアル アクション イベントの大規模なデータセット … 続きを読む
Seeing through the Brain: Image Reconstruction of Visual Perception from Human Brain Signals
要約 しかし、百聞は一見に如かずですが、人間の視覚認識がどのように認知と絡み合っ … 続きを読む
Dynamic Low-Rank Instance Adaptation for Universal Neural Image Compression
要約 ニューラル画像圧縮の最新の進歩は、従来の標準コーデックのレート歪み性能を超 … 続きを読む
カテゴリー: cs.CV, cs.MM, eess.IV, I.4.2; E.4
Dynamic Low-Rank Instance Adaptation for Universal Neural Image Compression はコメントを受け付けていません
SuS-X: Training-Free Name-Only Transfer of Vision-Language Models
要約 Contrastive Language-Image Pre-traini … 続きを読む