月別アーカイブ: 2024年3月

Text-Conditioned Resampler For Long Form Video Understanding

要約 この論文では、事前にトレーニングされフリーズされたビジュアル エンコーダー … 続きを読む

カテゴリー: cs.CV | Text-Conditioned Resampler For Long Form Video Understanding はコメントを受け付けていません

MambaIR: A Simple Baseline for Image Restoration with State-Space Model

要約 近年、画像復元は大幅に進歩しましたが、これは主に CNN やトランスフォー … 続きを読む

カテゴリー: cs.CV | MambaIR: A Simple Baseline for Image Restoration with State-Space Model はコメントを受け付けていません

An Image is Worth 1/2 Tokens After Layer 2: Plug-and-Play Inference Acceleration for Large Vision-Language Models

要約 この研究では、大規模視覚言語モデル (LVLM)、特に LLaVA-1.5 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | An Image is Worth 1/2 Tokens After Layer 2: Plug-and-Play Inference Acceleration for Large Vision-Language Models はコメントを受け付けていません

Meet JEANIE: a Similarity Measure for 3D Skeleton Sequences via Temporal-Viewpoint Alignment

要約 ビデオ シーケンスは、アクションの速度、時間的位置、および被験者のポーズに … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Meet JEANIE: a Similarity Measure for 3D Skeleton Sequences via Temporal-Viewpoint Alignment はコメントを受け付けていません

Towards Precise 3D Human Pose Estimation with Multi-Perspective Spatial-Temporal Relational Transformers

要約 3D 人間の姿勢推定は、奥行き情報と物理構造を維持しながら、3 次元空間内 … 続きを読む

カテゴリー: cs.CV, cs.RO, eess.IV | Towards Precise 3D Human Pose Estimation with Multi-Perspective Spatial-Temporal Relational Transformers はコメントを受け付けていません

Geometric Generative Models based on Morphological Equivariant PDEs and GANs

要約 コンテンツと画像の生成は、テクスチャ、エッジ、その他の薄い画像構造などの特 … 続きを読む

カテゴリー: cs.CV, eess.IV, math.DG | Geometric Generative Models based on Morphological Equivariant PDEs and GANs はコメントを受け付けていません

Diff-Def: Diffusion-Generated Deformation Fields for Conditional Atlases

要約 解剖学的アトラスは集団分析に広く使用されています。 条件付きアトラスは、特 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Diff-Def: Diffusion-Generated Deformation Fields for Conditional Atlases はコメントを受け付けていません

The Anatomy of Adversarial Attacks: Concept-based XAI Dissection

要約 敵対的攻撃 (AA) は、ディープ ニューラル ネットワークの信頼性と堅牢 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | The Anatomy of Adversarial Attacks: Concept-based XAI Dissection はコメントを受け付けていません

HPL-ESS: Hybrid Pseudo-Labeling for Unsupervised Event-based Semantic Segmentation

要約 イベントベースのセマンティック セグメンテーションは、従来の RGB カメ … 続きを読む

カテゴリー: cs.CV | HPL-ESS: Hybrid Pseudo-Labeling for Unsupervised Event-based Semantic Segmentation はコメントを受け付けていません

CurbNet: Curb Detection Framework Based on LiDAR Point Cloud Segmentation

要約 縁石検出はインテリジェント運転における重要な機能であり、道路の走行可能な領 … 続きを読む

カテゴリー: cs.CV, cs.RO | CurbNet: Curb Detection Framework Based on LiDAR Point Cloud Segmentation はコメントを受け付けていません