月別アーカイブ: 2023年8月

Three-stage binarization of color document images based on discrete wavelet transform and generative adversarial networks

要約 劣化したカラー文書画像において前景のテキスト情報を背景から効率的に分離する … 続きを読む

カテゴリー: cs.CV | Three-stage binarization of color document images based on discrete wavelet transform and generative adversarial networks はコメントを受け付けていません

Neural Network Training Strategy to Enhance Anomaly Detection Performance: A Perspective on Reconstruction Loss Amplification

要約 教師なし異常検出 (UAD) は、稀な異常の発生とデータの不均衡のため、業 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, eess.IV | Neural Network Training Strategy to Enhance Anomaly Detection Performance: A Perspective on Reconstruction Loss Amplification はコメントを受け付けていません

LatentDR: Improving Model Generalization Through Sample-Aware Latent Degradation and Restoration

要約 深層学習の大幅な進歩にも関わらず、特にトレーニング データが限られている場 … 続きを読む

カテゴリー: cs.CV, cs.LG | LatentDR: Improving Model Generalization Through Sample-Aware Latent Degradation and Restoration はコメントを受け付けていません

Adversarial Attacks on Foundational Vision Models

要約 CLIP、ALIGN、DINOv2 など、大規模で事前トレーニング済みのタ … 続きを読む

カテゴリー: cs.CR, cs.CV, cs.LG | Adversarial Attacks on Foundational Vision Models はコメントを受け付けていません

S-TREK: Sequential Translation and Rotation Equivariant Keypoints for local feature extraction

要約 この研究では、設計により平行移動と回転の両方が等価である深いキーポイント検 … 続きを読む

カテゴリー: cs.CV | S-TREK: Sequential Translation and Rotation Equivariant Keypoints for local feature extraction はコメントを受け付けていません

SPARTAN: Self-supervised Spatiotemporal Transformers Approach to Group Activity Recognition

要約 この論文では、ラベルのないビデオ データを使用したグループ活動認識 (GA … 続きを読む

カテゴリー: cs.CV | SPARTAN: Self-supervised Spatiotemporal Transformers Approach to Group Activity Recognition はコメントを受け付けていません

SAM-PARSER: Fine-tuning SAM Efficiently by Parameter Space Reconstruction

要約 Segment Anything Model (SAM) は、画像内のオブ … 続きを読む

カテゴリー: cs.CV | SAM-PARSER: Fine-tuning SAM Efficiently by Parameter Space Reconstruction はコメントを受け付けていません

SoGAR: Self-supervised Spatiotemporal Attention-based Social Group Activity Recognition

要約 この論文では、ラベルのないビデオ データを効果的に利用できる自己教師ありト … 続きを読む

カテゴリー: cs.CV | SoGAR: Self-supervised Spatiotemporal Attention-based Social Group Activity Recognition はコメントを受け付けていません

A Generalization of Continuous Relaxation in Structured Pruning

要約 ディープ ラーニングは、大規模な並列浮動小数点処理を利用して、大規模なニュ … 続きを読む

カテゴリー: cs.CV | A Generalization of Continuous Relaxation in Structured Pruning はコメントを受け付けていません

A Transformer-Conditioned Neural Fields Pipeline with Polar Coordinate Representation for Astronomical Radio Interferometric Data Reconstruction

要約 電波天文学では、電波望遠鏡からの波信号の測定値である視程データが、遠くの天 … 続きを読む

カテゴリー: astro-ph.IM, cs.AI, cs.CV | A Transformer-Conditioned Neural Fields Pipeline with Polar Coordinate Representation for Astronomical Radio Interferometric Data Reconstruction はコメントを受け付けていません