投稿者「jarxiv」のアーカイブ

A Wavelet-based Stereo Matching Framework for Solving Frequency Convergence Inconsistency

投稿日: 2025年5月26日作成者: jarxiv

要約 Raft-stereoのEPE評価メトリックは、低周波数領域と高周波領域で … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

3D Face Reconstruction Error Decomposed: A Modular Benchmark for Fair and Fast Method Evaluation

投稿日: 2025年5月26日作成者: jarxiv

要約 3Dフェイス再構成の標準ベンチマークメトリック、すなわち幾何学的エラーの計 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Knot So Simple: A Minimalistic Environment for Spatial Reasoning

投稿日: 2025年5月26日作成者: jarxiv

要約複雑で空間的な推論と操作のためのインタラクティブな環境であるKnotgym … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Mahalanobis++: Improving OOD Detection via Feature Normalization

投稿日: 2025年5月26日作成者: jarxiv

要約分散分布（OOD）の検出例は、安全性クリティアルアプリケーションに信頼でき … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

CAMME: Adaptive Deepfake Image Detection with Multi-Modal Cross-Attention

投稿日: 2025年5月26日作成者: jarxiv

要約洗練されたAIに生成されたディープフェイクの急増は、デジタルメディア認証と … 続きを読む →

カテゴリー: cs.CV, F.2.2 | コメントを受け付けていません

RBench-V: A Primary Assessment for Visual Reasoning Models with Multi-modal Outputs

投稿日: 2025年5月26日作成者: jarxiv

要約 GPT-4O、Gemini、およびO3によって例示されたネイティブマルチモ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Clip4Retrofit: Enabling Real-Time Image Labeling on Edge Devices via Cross-Architecture CLIP Distillation

投稿日: 2025年5月26日作成者: jarxiv

要約 Clip（Contrastive Language-Image Pretr … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

CostFilter-AD: Enhancing Anomaly Detection through Matching Cost Filtering

投稿日: 2025年5月26日作成者: jarxiv

要約監視されていない異常検出（UAD）は、通常のサンプルに関して入力画像の異常 … 続きを読む →

カテゴリー: cs.AI, cs.CV, eess.IV | コメントを受け付けていません

RestoreVAR: Visual Autoregressive Generation for All-in-One Image Restoration

投稿日: 2025年5月26日作成者: jarxiv

要約安定した拡散などの潜在的な拡散モデル（LDMS）の使用は、オールインワン画 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

SHARDeg: A Benchmark for Skeletal Human Action Recognition in Degraded Scenarios

投稿日: 2025年5月26日作成者: jarxiv

要約検出、予測、または分類タスクのコンピュータービジョン（CV）モデルは、リア … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

投稿者「jarxiv」のアーカイブ

A Wavelet-based Stereo Matching Framework for Solving Frequency Convergence Inconsistency

3D Face Reconstruction Error Decomposed: A Modular Benchmark for Fair and Fast Method Evaluation

Knot So Simple: A Minimalistic Environment for Spatial Reasoning

Mahalanobis++: Improving OOD Detection via Feature Normalization

CAMME: Adaptive Deepfake Image Detection with Multi-Modal Cross-Attention

RBench-V: A Primary Assessment for Visual Reasoning Models with Multi-modal Outputs

Clip4Retrofit: Enabling Real-Time Image Labeling on Edge Devices via Cross-Architecture CLIP Distillation

CostFilter-AD: Enhancing Anomaly Detection through Matching Cost Filtering

RestoreVAR: Visual Autoregressive Generation for All-in-One Image Restoration

SHARDeg: A Benchmark for Skeletal Human Action Recognition in Degraded Scenarios

最近の投稿

最近のコメント

アーカイブ

カテゴリー