月別アーカイブ: 2024年8月

VAR-CLIP: Text-to-Image Generator with Visual Auto-Regressive Modeling

要約 VARは、「ネクストトークン予測」とは対照的に、「ネクストスケール予測」を … 続きを読む

カテゴリー: cs.CV | VAR-CLIP: Text-to-Image Generator with Visual Auto-Regressive Modeling はコメントを受け付けていません

A Weakly Supervised and Globally Explainable Learning Framework for Brain Tumor Segmentation

要約 機械ベースの脳腫瘍セグメンテーションは、医師がより良い診断を下すのに役立つ … 続きを読む

カテゴリー: cs.CV | A Weakly Supervised and Globally Explainable Learning Framework for Brain Tumor Segmentation はコメントを受け付けていません

S2TD-Face: Reconstruct a Detailed 3D Face with Controllable Texture from a Single Sketch

要約 アニメーション、3Dアバター、芸術的デザイン、行方不明者の捜索など、多くの … 続きを読む

カテゴリー: cs.CV | S2TD-Face: Reconstruct a Detailed 3D Face with Controllable Texture from a Single Sketch はコメントを受け付けていません

Multi-head Spatial-Spectral Mamba for Hyperspectral Image Classification

要約 Spatial-Spectral Mamba (SSM)は、計算効率を向上 … 続きを読む

カテゴリー: cs.CV | Multi-head Spatial-Spectral Mamba for Hyperspectral Image Classification はコメントを受け付けていません

The Phantom Menace: Unmasking Privacy Leakages in Vision-Language Models

要約 視覚言語モデル(VLMs)は、視覚とテキスト理解を組み合わせることで、画像 … 続きを読む

カテゴリー: cs.CV | The Phantom Menace: Unmasking Privacy Leakages in Vision-Language Models はコメントを受け付けていません

WaveMamba: Spatial-Spectral Wavelet Mamba for Hyperspectral Image Classification

要約 ハイパースペクトルイメージング(HSI)は、多様なアプリケーションにおいて … 続きを読む

カテゴリー: cs.CV, eess.IV | WaveMamba: Spatial-Spectral Wavelet Mamba for Hyperspectral Image Classification はコメントを受け付けていません

CLIP4Sketch: Enhancing Sketch to Mugshot Matching through Dataset Augmentation using Diffusion Models

要約 法医学的スケッチと顔写真の照合は、顔認識における困難なタスクであり、主に、 … 続きを読む

カテゴリー: cs.CV | CLIP4Sketch: Enhancing Sketch to Mugshot Matching through Dataset Augmentation using Diffusion Models はコメントを受け付けていません

Conformal Trajectory Prediction with Multi-View Data Integration in Cooperative Driving

要約 軌道予測に関する現在の研究は、主に自車両の車載センサーによって収集されたデ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Conformal Trajectory Prediction with Multi-View Data Integration in Cooperative Driving はコメントを受け付けていません

Vision Transformers: From Semantic Segmentation to Dense Prediction

要約 画像分類における視覚変換器(ViT)の出現は、視覚表現学習の方法論を転換さ … 続きを読む

カテゴリー: cs.CV | Vision Transformers: From Semantic Segmentation to Dense Prediction はコメントを受け付けていません

Incremental Object-Based Novelty Detection with Feedback Loop

要約 物体ベースの新規性検出(ND)は、物体検出モデルが学習中に見たクラスに属さ … 続きを読む

カテゴリー: cs.CV | Incremental Object-Based Novelty Detection with Feedback Loop はコメントを受け付けていません