
Do text-free diffusion models learn discriminative visual representations?

要約 多くの教師なし学習モデルは、生成または識別のいずれか 1 つのタスク群に焦 … 続きを読む

カテゴリー: cs.CV | Do text-free diffusion models learn discriminative visual representations? はコメントを受け付けていません

Self-Supervised Any-Point Tracking by Contrastive Random Walks

要約 我々は、Tracking Any Point (TAP) 問題に対するシン … 続きを読む

カテゴリー: cs.CV | Self-Supervised Any-Point Tracking by Contrastive Random Walks はコメントを受け付けていません

BRDF-NeRF: Neural Radiance Fields with Optical Satellite Images and BRDF Modelling

要約 衛星画像から複雑な地球表面の異方性反射率を理解することは、多くの用途にとっ … 続きを読む

カテゴリー: cs.CV | BRDF-NeRF: Neural Radiance Fields with Optical Satellite Images and BRDF Modelling はコメントを受け付けていません

NN-Copula-CD: A Copula-Guided Interpretable Neural Network for Change Detection in Heterogeneous Remote Sensing Images

要約 異種リモートセンシング画像における変化検出 (CD) は、災害監視や土地利 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | NN-Copula-CD: A Copula-Guided Interpretable Neural Network for Change Detection in Heterogeneous Remote Sensing Images はコメントを受け付けていません

LaMamba-Diff: Linear-Time High-Fidelity Diffusion Models Based on Local Attention and Mamba

要約 最近の Transformer ベースの拡散モデルは、顕著なパフォーマンス … 続きを読む

カテゴリー: cs.CV | LaMamba-Diff: Linear-Time High-Fidelity Diffusion Models Based on Local Attention and Mamba はコメントを受け付けていません

3DGS-Calib: 3D Gaussian Splatting for Multimodal SpatioTemporal Calibration

要約 信頼性の高いマルチモーダル センサー フュージョン アルゴリズムには、正確 … 続きを読む

カテゴリー: cs.CV, cs.RO | 3DGS-Calib: 3D Gaussian Splatting for Multimodal SpatioTemporal Calibration はコメントを受け付けていません

RaggeDi: Diffusion-based State Estimation of Disordered Rags, Sheets, Towels and Blankets

要約 布地の状態推定はロボット工学における重要な問題です。 布を操作し、ロボット … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | RaggeDi: Diffusion-based State Estimation of Disordered Rags, Sheets, Towels and Blankets はコメントを受け付けていません

Physically-Based Photometric Bundle Adjustment in Non-Lambertian Environments

要約 フォトメトリック バンドル調整 (PBA) は、ランバート世界を仮定してカ … 続きを読む

カテゴリー: cs.CV, cs.RO | Physically-Based Photometric Bundle Adjustment in Non-Lambertian Environments はコメントを受け付けていません

Finding the Subjective Truth: Collecting 2 Million Votes for Comprehensive Gen-AI Model Evaluation

要約 テキストから画像へのモデルのパフォーマンスを効率的に評価することは、本質的 … 続きを読む

カテゴリー: cs.AI, cs.CV | Finding the Subjective Truth: Collecting 2 Million Votes for Comprehensive Gen-AI Model Evaluation はコメントを受け付けていません

Agglomerative Token Clustering

要約 我々は、画像分類、画像合成、オブジェクト検出とセグメンテーションのタスクに … 続きを読む

カテゴリー: cs.CV | Agglomerative Token Clustering はコメントを受け付けていません