月別アーカイブ: 2024年8月

VAR-CLIP: Text-to-Image Generator with Visual Auto-Regressive Modeling

投稿日: 2024年8月5日作成者: jarxiv

要約 VARは、「ネクストトークン予測」とは対照的に、「ネクストスケール予測」を … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

A Weakly Supervised and Globally Explainable Learning Framework for Brain Tumor Segmentation

投稿日: 2024年8月5日作成者: jarxiv

要約機械ベースの脳腫瘍セグメンテーションは、医師がより良い診断を下すのに役立つ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

S2TD-Face: Reconstruct a Detailed 3D Face with Controllable Texture from a Single Sketch

投稿日: 2024年8月5日作成者: jarxiv

要約アニメーション、3Dアバター、芸術的デザイン、行方不明者の捜索など、多くの … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Multi-head Spatial-Spectral Mamba for Hyperspectral Image Classification

投稿日: 2024年8月5日作成者: jarxiv

要約 Spatial-Spectral Mamba (SSM)は、計算効率を向上 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

The Phantom Menace: Unmasking Privacy Leakages in Vision-Language Models

投稿日: 2024年8月5日作成者: jarxiv

要約視覚言語モデル(VLMs)は、視覚とテキスト理解を組み合わせることで、画像 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

WaveMamba: Spatial-Spectral Wavelet Mamba for Hyperspectral Image Classification

投稿日: 2024年8月5日作成者: jarxiv

要約ハイパースペクトルイメージング(HSI)は、多様なアプリケーションにおいて … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

CLIP4Sketch: Enhancing Sketch to Mugshot Matching through Dataset Augmentation using Diffusion Models

投稿日: 2024年8月5日作成者: jarxiv

要約法医学的スケッチと顔写真の照合は、顔認識における困難なタスクであり、主に、 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Conformal Trajectory Prediction with Multi-View Data Integration in Cooperative Driving

投稿日: 2024年8月5日作成者: jarxiv

要約軌道予測に関する現在の研究は、主に自車両の車載センサーによって収集されたデ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Vision Transformers: From Semantic Segmentation to Dense Prediction

投稿日: 2024年8月5日作成者: jarxiv

要約画像分類における視覚変換器（ViT）の出現は、視覚表現学習の方法論を転換さ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Incremental Object-Based Novelty Detection with Feedback Loop

投稿日: 2024年8月5日作成者: jarxiv

要約物体ベースの新規性検出（ND）は、物体検出モデルが学習中に見たクラスに属さ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2024年8月

VAR-CLIP: Text-to-Image Generator with Visual Auto-Regressive Modeling

A Weakly Supervised and Globally Explainable Learning Framework for Brain Tumor Segmentation

S2TD-Face: Reconstruct a Detailed 3D Face with Controllable Texture from a Single Sketch

Multi-head Spatial-Spectral Mamba for Hyperspectral Image Classification

The Phantom Menace: Unmasking Privacy Leakages in Vision-Language Models

WaveMamba: Spatial-Spectral Wavelet Mamba for Hyperspectral Image Classification

CLIP4Sketch: Enhancing Sketch to Mugshot Matching through Dataset Augmentation using Diffusion Models

Conformal Trajectory Prediction with Multi-View Data Integration in Cooperative Driving

Vision Transformers: From Semantic Segmentation to Dense Prediction

Incremental Object-Based Novelty Detection with Feedback Loop

最近の投稿

最近のコメント

アーカイブ

カテゴリー