cs.MM」カテゴリーアーカイブ

Audio-Visual Glance Network for Efficient Video Recognition

要約 ディープラーニングはビデオ理解タスクにおいて大幅な進歩を遂げましたが、クリ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | Audio-Visual Glance Network for Efficient Video Recognition はコメントを受け付けていません

RLIPv2: Fast Scaling of Relational Language-Image Pre-training

要約 リレーショナル言語イメージ事前トレーニング (RLIP) は、ビジョン表現 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | RLIPv2: Fast Scaling of Relational Language-Image Pre-training はコメントを受け付けていません

A Shift In Artistic Practices through Artificial Intelligence

要約 人工知能モデルによって生成されたコンテンツの爆発的な増加により、芸術、音楽 … 続きを読む

カテゴリー: cs.AI, cs.CY, cs.MM | A Shift In Artistic Practices through Artificial Intelligence はコメントを受け付けていません

Language-Guided Diffusion Model for Visual Grounding

要約 ビジュアル グラウンディング (VG) タスクには、提供された言語フレーズ … 続きを読む

カテゴリー: cs.CV, cs.MM | Language-Guided Diffusion Model for Visual Grounding はコメントを受け付けていません

KeyPosS: Plug-and-Play Facial Landmark Detection through GPS-Inspired True-Range Multilateration

要約 顔分析の分野では、顔認識や表情分析からアニメーションに至るまで、さまざまな … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | KeyPosS: Plug-and-Play Facial Landmark Detection through GPS-Inspired True-Range Multilateration はコメントを受け付けていません

PoSynDA: Multi-Hypothesis Pose Synthesis Domain Adaptation for Robust 3D Human Pose Estimation

要約 現在の 3D 人間の姿勢推定器は、ターゲット ドメインのトレーニング セッ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM, cs.RO | PoSynDA: Multi-Hypothesis Pose Synthesis Domain Adaptation for Robust 3D Human Pose Estimation はコメントを受け付けていません

Audiovisual Moments in Time: A Large-Scale Annotated Dataset of Audiovisual Actions

要約 私たちは、オーディオビジュアル アクション イベントの大規模なデータセット … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.MM, cs.SD, eess.AS | Audiovisual Moments in Time: A Large-Scale Annotated Dataset of Audiovisual Actions はコメントを受け付けていません

Seeing through the Brain: Image Reconstruction of Visual Perception from Human Brain Signals

要約 しかし、百聞は一見に如かずですが、人間の視覚認識がどのように認知と絡み合っ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM, eess.IV, q-bio.NC | Seeing through the Brain: Image Reconstruction of Visual Perception from Human Brain Signals はコメントを受け付けていません

Dynamic Low-Rank Instance Adaptation for Universal Neural Image Compression

要約 ニューラル画像圧縮の最新の進歩は、従来の標準コーデックのレート歪み性能を超 … 続きを読む

カテゴリー: cs.CV, cs.MM, eess.IV, I.4.2; E.4 | Dynamic Low-Rank Instance Adaptation for Universal Neural Image Compression はコメントを受け付けていません

SuS-X: Training-Free Name-Only Transfer of Vision-Language Models

要約 Contrastive Language-Image Pre-traini … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.MM | SuS-X: Training-Free Name-Only Transfer of Vision-Language Models はコメントを受け付けていません