月別アーカイブ: 2024年6月

Enhancing Vision Models for Text-Heavy Content Understanding and Interaction

要約 複数の画像を含むテキストの多いビジュアル コンテンツを操作して理解すること … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Enhancing Vision Models for Text-Heavy Content Understanding and Interaction はコメントを受け付けていません

Predicting ptychography probe positions using single-shot phase retrieval neural network

要約 タイコグラフィーは、材料科学、生物学、ナノテクノロジーなどのさまざまな分野 … 続きを読む

カテゴリー: 94A08, cs.AI, cs.CV, I.4.0, physics.app-ph, physics.data-an | Predicting ptychography probe positions using single-shot phase retrieval neural network はコメントを受け付けていません

Fast yet Safe: Early-Exiting with Risk Control

要約 機械学習モデルをスケーリングすると、パフォーマンスが大幅に向上します。 た … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, stat.ML | Fast yet Safe: Early-Exiting with Risk Control はコメントを受け付けていません

Memory Consolidation Enables Long-Context Video Understanding

要約 ほとんどのトランスフォーマーベースのビデオ エンコーダーは、二次的な複雑さ … 続きを読む

カテゴリー: cs.CV | Memory Consolidation Enables Long-Context Video Understanding はコメントを受け付けていません

HQ-DiT: Efficient Diffusion Transformer with FP4 Hybrid Quantization

要約 拡散トランス (DiT) は、U-Net を使用する従来の拡散モデルを上回 … 続きを読む

カテゴリー: cs.AI, cs.CV | HQ-DiT: Efficient Diffusion Transformer with FP4 Hybrid Quantization はコメントを受け付けていません

The Victim and The Beneficiary: Exploiting a Poisoned Model to Train a Clean Model on Poisoned Data

要約 最近、バックドア攻撃がディープ ニューラル ネットワーク (DNN) のト … 続きを読む

カテゴリー: cs.CV | The Victim and The Beneficiary: Exploiting a Poisoned Model to Train a Clean Model on Poisoned Data はコメントを受け付けていません

Towards Imbalanced Motion: Part-Decoupling Network for Video Portrait Segmentation

要約 ビデオ ポートレート セグメンテーション (VPS) は、ビデオ フレーム … 続きを読む

カテゴリー: cs.CV | Towards Imbalanced Motion: Part-Decoupling Network for Video Portrait Segmentation はコメントを受け付けていません

Behind Every Domain There is a Shift: Adapting Distortion-aware Vision Transformers for Panoramic Semantic Segmentation

要約 この論文では、次の 2 つの重要な課題のために十分に研究されていないパノラ … 続きを読む

カテゴリー: cs.CV, cs.RO, eess.IV | Behind Every Domain There is a Shift: Adapting Distortion-aware Vision Transformers for Panoramic Semantic Segmentation はコメントを受け付けていません

Pre- to Post-Contrast Breast MRI Synthesis for Enhanced Tumour Segmentation

要約 ダイナミック造影 MRI (DCE-MRI) における造影剤の投与は、腫瘍 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Pre- to Post-Contrast Breast MRI Synthesis for Enhanced Tumour Segmentation はコメントを受け付けていません

Amortizing intractable inference in diffusion models for vision, language, and control

要約 拡散モデルは、視覚、言語、強化学習における効果的な分布推定器として登場しま … 続きを読む

カテゴリー: cs.CV, cs.LG | Amortizing intractable inference in diffusion models for vision, language, and control はコメントを受け付けていません