月別アーカイブ: 2024年4月

MambaAD: Exploring State Space Models for Multi-class Unsupervised Anomaly Detection

要約 異常検出における最近の進歩により、CNN およびトランスフォーマー ベース … 続きを読む

カテゴリー: cs.CV | MambaAD: Exploring State Space Models for Multi-class Unsupervised Anomaly Detection はコメントを受け付けていません

Context-aware Video Anomaly Detection in Long-Term Datasets

要約 ビデオ異常検出の研究は通常、わずか数分の短い独立したベンチマーク ビデオで … 続きを読む

カテゴリー: cs.CV | Context-aware Video Anomaly Detection in Long-Term Datasets はコメントを受け付けていません

EgoGen: An Egocentric Synthetic Data Generator

要約 一人称視点で世界を理解することは、拡張現実 (AR) の基本です。 この没 … 続きを読む

カテゴリー: cs.AI, cs.CV | EgoGen: An Egocentric Synthetic Data Generator はコメントを受け付けていません

Low-Resource Vision Challenges for Foundation Models

要約 自然言語処理では低リソース設定が確立されており、多くの言語では大規模な深層 … 続きを読む

カテゴリー: cs.CV | Low-Resource Vision Challenges for Foundation Models はコメントを受け付けていません

LaVy: Vietnamese Multimodal Large Language Model

要約 大規模言語モデル (LLM) とマルチモーダル大規模言語モデル (MLLM … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | LaVy: Vietnamese Multimodal Large Language Model はコメントを受け付けていません

Parameter Hierarchical Optimization for Visible-Infrared Person Re-Identification

要約 可視赤外線人物再識別 (VI-reID) は、別々の可視カメラまたは赤外線 … 続きを読む

カテゴリー: cs.AI, cs.CV | Parameter Hierarchical Optimization for Visible-Infrared Person Re-Identification はコメントを受け付けていません

FusionMamba: Efficient Image Fusion with State Space Model

要約 画像融合は、スペクトル情報が限られた高解像度画像と豊富なスペクトルデータを … 続きを読む

カテゴリー: cs.CV, eess.IV | FusionMamba: Efficient Image Fusion with State Space Model はコメントを受け付けていません

Boosting Self-Supervision for Single-View Scene Completion via Knowledge Distillation

要約 Structure from Motion を介して画像からシーンのジオメ … 続きを読む

カテゴリー: cs.CV | Boosting Self-Supervision for Single-View Scene Completion via Knowledge Distillation はコメントを受け付けていません

Taming Stable Diffusion for Text to 360° Panorama Image Generation

要約 安定拡散などの生成モデルにより、テキスト プロンプトからフォトリアリスティ … 続きを読む

カテゴリー: cs.CV | Taming Stable Diffusion for Text to 360° Panorama Image Generation はコメントを受け付けていません

Ferret-v2: An Improved Baseline for Referring and Grounding with Large Language Models

要約 Ferret は、地域の理解を大規模言語モデル (LLM) にシームレスに … 続きを読む

カテゴリー: cs.CV | Ferret-v2: An Improved Baseline for Referring and Grounding with Large Language Models はコメントを受け付けていません