-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.MM」カテゴリーアーカイブ
Language-Guided Diffusion Model for Visual Grounding
要約 ビジュアル グラウンディング (VG) タスクには、提供された言語フレーズ … 続きを読む
KeyPosS: Plug-and-Play Facial Landmark Detection through GPS-Inspired True-Range Multilateration
要約 顔分析の分野では、顔認識や表情分析からアニメーションに至るまで、さまざまな … 続きを読む
PoSynDA: Multi-Hypothesis Pose Synthesis Domain Adaptation for Robust 3D Human Pose Estimation
要約 現在の 3D 人間の姿勢推定器は、ターゲット ドメインのトレーニング セッ … 続きを読む
Audiovisual Moments in Time: A Large-Scale Annotated Dataset of Audiovisual Actions
要約 私たちは、オーディオビジュアル アクション イベントの大規模なデータセット … 続きを読む
Seeing through the Brain: Image Reconstruction of Visual Perception from Human Brain Signals
要約 しかし、百聞は一見に如かずですが、人間の視覚認識がどのように認知と絡み合っ … 続きを読む
Dynamic Low-Rank Instance Adaptation for Universal Neural Image Compression
要約 ニューラル画像圧縮の最新の進歩は、従来の標準コーデックのレート歪み性能を超 … 続きを読む
カテゴリー: cs.CV, cs.MM, eess.IV, I.4.2; E.4
Dynamic Low-Rank Instance Adaptation for Universal Neural Image Compression はコメントを受け付けていません
SuS-X: Training-Free Name-Only Transfer of Vision-Language Models
要約 Contrastive Language-Image Pre-traini … 続きを読む
MACO: A Modality Adversarial and Contrastive Framework for Modality-missing Multi-modal Knowledge Graph Completion
要約 近年、マルチモーダルナレッジグラフ補完 (MMKGC) が大幅に進歩しまし … 続きを読む
Temporal Sentence Grounding in Streaming Videos
要約 この論文は、ストリーミング ビデオにおける時間的センテンス グラウンディン … 続きを読む
CTP: Towards Vision-Language Continual Pretraining via Compatible Momentum Contrast and Topology Preservation
要約 Vision-Language Pretraining (VLP) は、大 … 続きを読む