月別アーカイブ: 2024年9月

Label-Augmented Dataset Distillation

投稿日: 2024年9月26日作成者: jarxiv

要約従来のデータセットの抽出では、主に画像表現に焦点を当てていましたが、ラベル … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Fields of The World: A Machine Learning Benchmark Dataset For Global Agricultural Field Boundary Segmentation

投稿日: 2024年9月26日作成者: jarxiv

要約作物畑の境界は、農業の監視と評価のための基礎的なデータセットですが、手動で … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

CDChat: A Large Multimodal Model for Remote Sensing Change Description

投稿日: 2024年9月26日作成者: jarxiv

要約大規模マルチモーダルモデル (LMM) は、視覚的命令チューニングを使用 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

AIM 2024 Challenge on UHD Blind Photo Quality Assessment

投稿日: 2024年9月26日作成者: jarxiv

要約最新の高解像度写真の非参照画質評価 (NR-IQA) タスクを推進するコン … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Compressed Depth Map Super-Resolution and Restoration: AIM 2024 Challenge Results

投稿日: 2024年9月26日作成者: jarxiv

要約拡張現実 (AR) および仮想現実 (VR) アプリケーションに対する需要 … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Semantic Refocused Tuning for Open-Vocabulary Panoptic Segmentation

投稿日: 2024年9月26日作成者: jarxiv

要約オープンボキャブラリーのパノプティックセグメンテーションは、一連のテキスト … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

MonoFormer: One Transformer for Both Diffusion and Autoregression

投稿日: 2024年9月26日作成者: jarxiv

要約既存のマルチモダリティ手法のほとんどは、自己回帰ベースの離散テキスト生成と … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Gen2Act: Human Video Generation in Novel Scenarios enables Generalizable Robot Manipulation

投稿日: 2024年9月26日作成者: jarxiv

要約ロボット操作ポリシーは、どのようにして、目に見えないオブジェクトタイプや新 … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.RO, eess.IV | コメントを受け付けていません

Do text-free diffusion models learn discriminative visual representations?

投稿日: 2024年9月26日作成者: jarxiv

要約多くの教師なし学習モデルは、生成または識別のいずれか 1 つのタスク群に焦 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Self-Supervised Any-Point Tracking by Contrastive Random Walks

投稿日: 2024年9月26日作成者: jarxiv

要約我々は、Tracking Any Point (TAP) 問題に対するシン … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2024年9月

Label-Augmented Dataset Distillation

Fields of The World: A Machine Learning Benchmark Dataset For Global Agricultural Field Boundary Segmentation

CDChat: A Large Multimodal Model for Remote Sensing Change Description

AIM 2024 Challenge on UHD Blind Photo Quality Assessment

Compressed Depth Map Super-Resolution and Restoration: AIM 2024 Challenge Results

Semantic Refocused Tuning for Open-Vocabulary Panoptic Segmentation

MonoFormer: One Transformer for Both Diffusion and Autoregression

Gen2Act: Human Video Generation in Novel Scenarios enables Generalizable Robot Manipulation

Do text-free diffusion models learn discriminative visual representations?

Self-Supervised Any-Point Tracking by Contrastive Random Walks

最近の投稿

最近のコメント

アーカイブ

カテゴリー