投稿者「jarxiv」のアーカイブ

A Wavelet-based Stereo Matching Framework for Solving Frequency Convergence Inconsistency

要約 Raft-stereoのEPE評価メトリックは、低周波数領域と高周波領域で … 続きを読む

カテゴリー: cs.CV | A Wavelet-based Stereo Matching Framework for Solving Frequency Convergence Inconsistency はコメントを受け付けていません

3D Face Reconstruction Error Decomposed: A Modular Benchmark for Fair and Fast Method Evaluation

要約 3Dフェイス再構成の標準ベンチマークメトリック、すなわち幾何学的エラーの計 … 続きを読む

カテゴリー: cs.CV | 3D Face Reconstruction Error Decomposed: A Modular Benchmark for Fair and Fast Method Evaluation はコメントを受け付けていません

Knot So Simple: A Minimalistic Environment for Spatial Reasoning

要約 複雑で空間的な推論と操作のためのインタラクティブな環境であるKnotgym … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Knot So Simple: A Minimalistic Environment for Spatial Reasoning はコメントを受け付けていません

Mahalanobis++: Improving OOD Detection via Feature Normalization

要約 分散分布(OOD)の検出例は、安全性クリティアルアプリケーションに信頼でき … 続きを読む

カテゴリー: cs.CV, cs.LG | Mahalanobis++: Improving OOD Detection via Feature Normalization はコメントを受け付けていません

CAMME: Adaptive Deepfake Image Detection with Multi-Modal Cross-Attention

要約 洗練されたAIに生成されたディープフェイクの急増は、デジタルメディア認証と … 続きを読む

カテゴリー: cs.CV, F.2.2 | CAMME: Adaptive Deepfake Image Detection with Multi-Modal Cross-Attention はコメントを受け付けていません

RBench-V: A Primary Assessment for Visual Reasoning Models with Multi-modal Outputs

要約 GPT-4O、Gemini、およびO3によって例示されたネイティブマルチモ … 続きを読む

カテゴリー: cs.CV | RBench-V: A Primary Assessment for Visual Reasoning Models with Multi-modal Outputs はコメントを受け付けていません

Clip4Retrofit: Enabling Real-Time Image Labeling on Edge Devices via Cross-Architecture CLIP Distillation

要約 Clip(Contrastive Language-Image Pretr … 続きを読む

カテゴリー: cs.CV | Clip4Retrofit: Enabling Real-Time Image Labeling on Edge Devices via Cross-Architecture CLIP Distillation はコメントを受け付けていません

CostFilter-AD: Enhancing Anomaly Detection through Matching Cost Filtering

要約 監視されていない異常検出(UAD)は、通常のサンプルに関して入力画像の異常 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | CostFilter-AD: Enhancing Anomaly Detection through Matching Cost Filtering はコメントを受け付けていません

RestoreVAR: Visual Autoregressive Generation for All-in-One Image Restoration

要約 安定した拡散などの潜在的な拡散モデル(LDMS)の使用は、オールインワン画 … 続きを読む

カテゴリー: cs.AI, cs.CV | RestoreVAR: Visual Autoregressive Generation for All-in-One Image Restoration はコメントを受け付けていません

SHARDeg: A Benchmark for Skeletal Human Action Recognition in Degraded Scenarios

要約 検出、予測、または分類タスクのコンピュータービジョン(CV)モデルは、リア … 続きを読む

カテゴリー: cs.CV | SHARDeg: A Benchmark for Skeletal Human Action Recognition in Degraded Scenarios はコメントを受け付けていません