月別アーカイブ: 2023年3月

National-scale 1-m resolution land-cover mapping for the entire China based on a low-cost solution and open-access data

要約 現在、多くの大規模な土地被覆 (LC) 製品がリリースされていますが、現在 … 続きを読む

カテゴリー: cs.CV, eess.IV | National-scale 1-m resolution land-cover mapping for the entire China based on a low-cost solution and open-access data はコメントを受け付けていません

SpyroPose: Importance Sampling Pyramids for Object Pose Distribution Estimation in SE(3)

要約 オブジェクトの姿勢推定は、コンピューター ビジョンの中核的な問題であり、多 … 続きを読む

カテゴリー: cs.CV, cs.RO | SpyroPose: Importance Sampling Pyramids for Object Pose Distribution Estimation in SE(3) はコメントを受け付けていません

MixSpeech: Cross-Modality Self-Learning with Audio-Visual Stream Mixup for Visual Speech Translation and Recognition

要約 マルチメディア通信は、人々の間のグローバルな相互作用を促進します。 しかし … 続きを読む

カテゴリー: cs.CL, cs.CV | MixSpeech: Cross-Modality Self-Learning with Audio-Visual Stream Mixup for Visual Speech Translation and Recognition はコメントを受け付けていません

3D Video Loops from Asynchronous Input

要約 ループ ビデオは、目に見える継ぎ目やアーティファクトなしで無限にループでき … 続きを読む

カテゴリー: cs.CV, cs.GR | 3D Video Loops from Asynchronous Input はコメントを受け付けていません

Replacement as a Self-supervision for Fine-grained Vision-language Pre-training

要約 オブジェクト アノテーションに基づくきめの細かい監視は、視覚と言語の事前ト … 続きを読む

カテゴリー: cs.CL, cs.CV | Replacement as a Self-supervision for Fine-grained Vision-language Pre-training はコメントを受け付けていません

WASD: A Wilder Active Speaker Detection Dataset

要約 現在のアクティブ スピーカー検出 (ASD) モデルは、音声と顔の特徴のみ … 続きを読む

カテゴリー: cs.CV, cs.SD, eess.AS, eess.IV | WASD: A Wilder Active Speaker Detection Dataset はコメントを受け付けていません

Controllable Video Generation by Learning the Underlying Dynamical System with Neural ODE

要約 ビデオは、時間の経過に伴う複雑な動的システムの変化を離散画像シーケンスの形 … 続きを読む

カテゴリー: cs.CV | Controllable Video Generation by Learning the Underlying Dynamical System with Neural ODE はコメントを受け付けていません

BaDLAD: A Large Multi-Domain Bengali Document Layout Analysis Dataset

要約 過去 10 年間で深層学習ベースのベンガル語光学式文字認識 (OCR) に … 続きを読む

カテゴリー: cs.CV | BaDLAD: A Large Multi-Domain Bengali Document Layout Analysis Dataset はコメントを受け付けていません

Masked Autoencoder for Self-Supervised Pre-training on Lidar Point Clouds

要約 マスクされた自動エンコードは、テキスト、画像、および最近では点群の Tra … 続きを読む

カテゴリー: cs.CV, cs.LG | Masked Autoencoder for Self-Supervised Pre-training on Lidar Point Clouds はコメントを受け付けていません

Tucker Bilinear Attention Network for Multi-scale Remote Sensing Object Detection

要約 VHR リモート センシング画像でのオブジェクト検出は、都市計画、土地資源 … 続きを読む

カテゴリー: cs.CV | Tucker Bilinear Attention Network for Multi-scale Remote Sensing Object Detection はコメントを受け付けていません