月別アーカイブ: 2024年6月

SKD-TSTSAN: Three-Stream Temporal-Shift Attention Network Based on Self-Knowledge Distillation for Micro-Expression Recognition

要約 微表情 (ME) は、人々が本当の感情を隠そうとするときに自然に起こる微妙 … 続きを読む

カテゴリー: cs.CV | SKD-TSTSAN: Three-Stream Temporal-Shift Attention Network Based on Self-Knowledge Distillation for Micro-Expression Recognition はコメントを受け付けていません

Soundify: Matching Sound Effects to Video

要約 ビデオ編集の分野では、サウンドはオブジェクトに個性を加え、視聴者を空間に没 … 続きを読む

カテゴリー: cs.CV, cs.HC, cs.MM, cs.SD, eess.AS | Soundify: Matching Sound Effects to Video はコメントを受け付けていません

Principal Component Clustering for Semantic Segmentation in Synthetic Data Generation

要約 この技術レポートでは、潜在拡散モデルを使用してセマンティック セグメンテー … 続きを読む

カテゴリー: cs.CV | Principal Component Clustering for Semantic Segmentation in Synthetic Data Generation はコメントを受け付けていません

Detection of Synthetic Face Images: Accuracy, Robustness, Generalization

要約 合成顔画像の検出に関する実験的研究を紹介します。 私たちは、最近の拡散モデ … 続きを読む

カテゴリー: cs.CV | Detection of Synthetic Face Images: Accuracy, Robustness, Generalization はコメントを受け付けていません

Instance-level quantitative saliency in multiple sclerosis lesion segmentation

要約 近年、人工知能の説明可能な手法 (XAI) により、分類タスクの場合のモデ … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Instance-level quantitative saliency in multiple sclerosis lesion segmentation はコメントを受け付けていません

Minimal Interaction Edge Tuning: A New Paradigm for Visual Adaptation

要約 大規模ビジョンの事前トレーニング済みモデルの急速なスケーリングにより、計算 … 続きを読む

カテゴリー: cs.CV | Minimal Interaction Edge Tuning: A New Paradigm for Visual Adaptation はコメントを受け付けていません

Toward Universal Medical Image Registration via Sharpness-Aware Meta-Continual Learning

要約 医療画像登録における現在の深層学習アプローチは、通常、配布の変更とデータ収 … 続きを読む

カテゴリー: cs.CV | Toward Universal Medical Image Registration via Sharpness-Aware Meta-Continual Learning はコメントを受け付けていません

Advancing Cell Detection in Anterior Segment Optical Coherence Tomography Images

要約 目の炎症の一般的な形態である前ブドウ膜炎は、速やかに診断されないと永久的な … 続きを読む

カテゴリー: cs.CV, eess.IV | Advancing Cell Detection in Anterior Segment Optical Coherence Tomography Images はコメントを受け付けていません

DocParseNet: Advanced Semantic Segmentation and OCR Embeddings for Efficient Scanned Document Annotation

要約 スキャンされたドキュメントの注釈を自動化することは困難であり、計算効率と精 … 続きを読む

カテゴリー: cs.CV | DocParseNet: Advanced Semantic Segmentation and OCR Embeddings for Efficient Scanned Document Annotation はコメントを受け付けていません

Director3D: Real-world Camera Trajectory and 3D Scene Generation from Text

要約 3D 生成の最近の進歩では、グラウンド トゥルース 3D アセットと事前定 … 続きを読む

カテゴリー: cs.CV | Director3D: Real-world Camera Trajectory and 3D Scene Generation from Text はコメントを受け付けていません