月別アーカイブ: 2023年5月

Improving the Accuracy-Robustness Trade-Off of Classifiers via Adaptive Smoothing

要約 これまでの研究では、ニューラル分類器の敵対的堅牢性を強化する多数の手法が提 … 続きを読む

カテゴリー: 68T07, cs.CR, cs.CV, cs.LG | Improving the Accuracy-Robustness Trade-Off of Classifiers via Adaptive Smoothing はコメントを受け付けていません

Multi-object Video Generation from Single Frame Layouts

要約 本稿では、生成条件の簡略化に重点を置いて映像合成を検討する。 既存のビデオ … 続きを読む

カテゴリー: cs.CV | Multi-object Video Generation from Single Frame Layouts はコメントを受け付けていません

Multi-BVOC Super-Resolution Exploiting Compounds Inter-Connection

要約 陸上生態系から地球の大気中に放出される生物由来の揮発性有機化合物 (BVO … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Multi-BVOC Super-Resolution Exploiting Compounds Inter-Connection はコメントを受け付けていません

The Best Defense is a Good Offense: Adversarial Augmentation against Adversarial Attacks

要約 敵対的攻撃に対する防御の多く (堅牢な分類器、ランダム化、画像浄化など) … 続きを読む

カテゴリー: cs.CR, cs.CV, cs.LG | The Best Defense is a Good Offense: Adversarial Augmentation against Adversarial Attacks はコメントを受け付けていません

SAD: Segment Any RGBD

要約 Segment Anything Model (SAM) は、2D RGB … 続きを読む

カテゴリー: cs.CV | SAD: Segment Any RGBD はコメントを受け付けていません

A Novel Sampling Scheme for Text- and Image-Conditional Image Synthesis in Quantized Latent Spaces

要約 テキストから画像への合成の分野における最近の進歩は、品質、忠実度、および多 … 続きを読む

カテゴリー: cs.CV, cs.LG | A Novel Sampling Scheme for Text- and Image-Conditional Image Synthesis in Quantized Latent Spaces はコメントを受け付けていません

DUBLIN — Document Understanding By Language-Image Network

要約 視覚的な文書の理解は、文書画像内のテキストと視覚的要素の両方の分析を伴う複 … 続きを読む

カテゴリー: cs.AI, cs.CV, F.2.2 | DUBLIN — Document Understanding By Language-Image Network はコメントを受け付けていません

Provably Learning Object-Centric Representations

要約 オブジェクトに関する視覚世界の構造化表現を学習すると、現在の機械学習モデル … 続きを読む

カテゴリー: cs.CV, cs.LG | Provably Learning Object-Centric Representations はコメントを受け付けていません

REC-MV: REconstructing 3D Dynamic Cloth from Monocular Videos

要約 単眼ビデオから開いた境界を持つ動的な 3D 衣服表面を再構成することは、衣 … 続きを読む

カテゴリー: cs.CV | REC-MV: REconstructing 3D Dynamic Cloth from Monocular Videos はコメントを受け付けていません

Training Transitive and Commutative Multimodal Transformers with LoReTTa

要約 2 つのペアのモダリティ A と B、または B と C を含むマルチモー … 続きを読む

カテゴリー: cs.AI, cs.CV | Training Transitive and Commutative Multimodal Transformers with LoReTTa はコメントを受け付けていません