月別アーカイブ: 2024年2月

StyleLipSync: Style-based Personalized Lip-sync Video Generation

要約 この論文では、任意のオーディオからアイデンティティに依存しないリップシンク … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | StyleLipSync: Style-based Personalized Lip-sync Video Generation はコメントを受け付けていません

TriAug: Out-of-Distribution Detection for Robust Classification of Imbalanced Breast Lesion in Ultrasound

要約 乳房病変の組織学的サブタイプなど、さまざまな病気の発生率は大きく異なります … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | TriAug: Out-of-Distribution Detection for Robust Classification of Imbalanced Breast Lesion in Ultrasound はコメントを受け付けていません

On the Exploitation of DCT-Traces in the Generative-AI Domain

要約 ディープフェイクは、特に最近の生成 AI ベースのソリューションで得られた … 続きを読む

カテゴリー: cs.CV, cs.LG | On the Exploitation of DCT-Traces in the Generative-AI Domain はコメントを受け付けていません

ClusterTabNet: Supervised clustering method for table detection and table structure recognition

要約 文書内の単語をクラスタリングする新しい深層学習ベースの方法を提案します。こ … 続きを読む

カテゴリー: cs.CV, cs.LG | ClusterTabNet: Supervised clustering method for table detection and table structure recognition はコメントを受け付けていません

EndoGS: Deformable Endoscopic Tissues Reconstruction with Gaussian Splatting

要約 外科用 3D 再構成はロボット手術における研究の重要な分野であり、最近の研 … 続きを読む

カテゴリー: cs.CV, cs.RO | EndoGS: Deformable Endoscopic Tissues Reconstruction with Gaussian Splatting はコメントを受け付けていません

SERNet-Former: Semantic Segmentation by Efficient Residual Network with Attention-Boosting Gates and Attention-Fusion Networks

要約 セマンティック セグメンテーションにおける最先端の手法の効率を向上させるに … 続きを読む

カテゴリー: cs.AI, cs.CV | SERNet-Former: Semantic Segmentation by Efficient Residual Network with Attention-Boosting Gates and Attention-Fusion Networks はコメントを受け付けていません

Morse sequences

要約 離散モールス理論へのシンプルかつ効果的なアプローチを提供するモールス系列の … 続きを読む

カテゴリー: cs.CV | Morse sequences はコメントを受け付けていません

SDAT: Sub-Dataset Alternation Training for Improved Image Demosaicing

要約 画像のデモザイクは、デジタル カメラの画像処理パイプラインにおける重要なス … 続きを読む

カテゴリー: cs.CV, eess.IV | SDAT: Sub-Dataset Alternation Training for Improved Image Demosaicing はコメントを受け付けていません

Revising deep learning methods in parking lot occupancy detection

要約 駐車誘導システムは、スマートシティ開発パラダイムの一環として、最近人気のト … 続きを読む

カテゴリー: cs.CV, cs.LG | Revising deep learning methods in parking lot occupancy detection はコメントを受け付けていません

Sheet Music Transformer: End-To-End Optical Music Recognition Beyond Monophonic Transcription

要約 最先端のエンドツーエンドの光学式音楽認識 (OMR) は、これまで主にモノ … 続きを読む

カテゴリー: cs.CV, cs.SD, eess.AS | Sheet Music Transformer: End-To-End Optical Music Recognition Beyond Monophonic Transcription はコメントを受け付けていません