月別アーカイブ: 2024年6月

SKD-TSTSAN: Three-Stream Temporal-Shift Attention Network Based on Self-Knowledge Distillation for Micro-Expression Recognition

投稿日: 2024年6月26日作成者: jarxiv

要約微表情 (ME) は、人々が本当の感情を隠そうとするときに自然に起こる微妙 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Soundify: Matching Sound Effects to Video

投稿日: 2024年6月26日作成者: jarxiv

要約ビデオ編集の分野では、サウンドはオブジェクトに個性を加え、視聴者を空間に没 … 続きを読む →

カテゴリー: cs.CV, cs.HC, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

Principal Component Clustering for Semantic Segmentation in Synthetic Data Generation

投稿日: 2024年6月26日作成者: jarxiv

要約この技術レポートでは、潜在拡散モデルを使用してセマンティックセグメンテー … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Detection of Synthetic Face Images: Accuracy, Robustness, Generalization

投稿日: 2024年6月26日作成者: jarxiv

要約合成顔画像の検出に関する実験的研究を紹介します。私たちは、最近の拡散モデ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Instance-level quantitative saliency in multiple sclerosis lesion segmentation

投稿日: 2024年6月26日作成者: jarxiv

要約近年、人工知能の説明可能な手法 (XAI) により、分類タスクの場合のモデ … 続きを読む →

カテゴリー: cs.CV, cs.LG, eess.IV | コメントを受け付けていません

Minimal Interaction Edge Tuning: A New Paradigm for Visual Adaptation

投稿日: 2024年6月26日作成者: jarxiv

要約大規模ビジョンの事前トレーニング済みモデルの急速なスケーリングにより、計算 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Toward Universal Medical Image Registration via Sharpness-Aware Meta-Continual Learning

投稿日: 2024年6月26日作成者: jarxiv

要約医療画像登録における現在の深層学習アプローチは、通常、配布の変更とデータ収 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Advancing Cell Detection in Anterior Segment Optical Coherence Tomography Images

投稿日: 2024年6月26日作成者: jarxiv

要約目の炎症の一般的な形態である前ブドウ膜炎は、速やかに診断されないと永久的な … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

DocParseNet: Advanced Semantic Segmentation and OCR Embeddings for Efficient Scanned Document Annotation

投稿日: 2024年6月26日作成者: jarxiv

要約スキャンされたドキュメントの注釈を自動化することは困難であり、計算効率と精 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Director3D: Real-world Camera Trajectory and 3D Scene Generation from Text

投稿日: 2024年6月26日作成者: jarxiv

要約 3D 生成の最近の進歩では、グラウンドトゥルース 3D アセットと事前定 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2024年6月

SKD-TSTSAN: Three-Stream Temporal-Shift Attention Network Based on Self-Knowledge Distillation for Micro-Expression Recognition

Soundify: Matching Sound Effects to Video

Principal Component Clustering for Semantic Segmentation in Synthetic Data Generation

Detection of Synthetic Face Images: Accuracy, Robustness, Generalization

Instance-level quantitative saliency in multiple sclerosis lesion segmentation

Minimal Interaction Edge Tuning: A New Paradigm for Visual Adaptation

Toward Universal Medical Image Registration via Sharpness-Aware Meta-Continual Learning

Advancing Cell Detection in Anterior Segment Optical Coherence Tomography Images

DocParseNet: Advanced Semantic Segmentation and OCR Embeddings for Efficient Scanned Document Annotation

Director3D: Real-world Camera Trajectory and 3D Scene Generation from Text

最近の投稿

最近のコメント

アーカイブ

カテゴリー