cs.CV」カテゴリーアーカイブ

Label-Augmented Dataset Distillation

要約 従来のデータセットの抽出では、主に画像表現に焦点を当てていましたが、ラベル … 続きを読む

カテゴリー: cs.AI, cs.CV | Label-Augmented Dataset Distillation はコメントを受け付けていません

Fields of The World: A Machine Learning Benchmark Dataset For Global Agricultural Field Boundary Segmentation

要約 作物畑の境界は、農業の監視と評価のための基礎的なデータセットですが、手動で … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Fields of The World: A Machine Learning Benchmark Dataset For Global Agricultural Field Boundary Segmentation はコメントを受け付けていません

CDChat: A Large Multimodal Model for Remote Sensing Change Description

要約 大規模マルチモーダル モデル (LMM) は、視覚的命令チューニングを使用 … 続きを読む

カテゴリー: cs.CV | CDChat: A Large Multimodal Model for Remote Sensing Change Description はコメントを受け付けていません

AIM 2024 Challenge on UHD Blind Photo Quality Assessment

要約 最新の高解像度写真の非参照画質評価 (NR-IQA) タスクを推進するコン … 続きを読む

カテゴリー: cs.CV | AIM 2024 Challenge on UHD Blind Photo Quality Assessment はコメントを受け付けていません

Compressed Depth Map Super-Resolution and Restoration: AIM 2024 Challenge Results

要約 拡張現実 (AR) および仮想現実 (VR) アプリケーションに対する需要 … 続きを読む

カテゴリー: cs.CV, eess.IV | Compressed Depth Map Super-Resolution and Restoration: AIM 2024 Challenge Results はコメントを受け付けていません

Semantic Refocused Tuning for Open-Vocabulary Panoptic Segmentation

要約 オープンボキャブラリーのパノプティックセグメンテーションは、一連のテキスト … 続きを読む

カテゴリー: cs.CV | Semantic Refocused Tuning for Open-Vocabulary Panoptic Segmentation はコメントを受け付けていません

MonoFormer: One Transformer for Both Diffusion and Autoregression

要約 既存のマルチモダリティ手法のほとんどは、自己回帰ベースの離散テキスト生成と … 続きを読む

カテゴリー: cs.CV | MonoFormer: One Transformer for Both Diffusion and Autoregression はコメントを受け付けていません

Gen2Act: Human Video Generation in Novel Scenarios enables Generalizable Robot Manipulation

要約 ロボット操作ポリシーは、どのようにして、目に見えないオブジェクトタイプや新 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO, eess.IV | Gen2Act: Human Video Generation in Novel Scenarios enables Generalizable Robot Manipulation はコメントを受け付けていません

Do text-free diffusion models learn discriminative visual representations?

要約 多くの教師なし学習モデルは、生成または識別のいずれか 1 つのタスク群に焦 … 続きを読む

カテゴリー: cs.CV | Do text-free diffusion models learn discriminative visual representations? はコメントを受け付けていません

Self-Supervised Any-Point Tracking by Contrastive Random Walks

要約 我々は、Tracking Any Point (TAP) 問題に対するシン … 続きを読む

カテゴリー: cs.CV | Self-Supervised Any-Point Tracking by Contrastive Random Walks はコメントを受け付けていません