月別アーカイブ: 2024年3月

Decomposing Disease Descriptions for Enhanced Pathology Detection: A Multi-Aspect Vision-Language Pre-training Framework

要約 医療ビジョン言語事前トレーニング (VLP) は研究の最前線として浮上して … 続きを読む

カテゴリー: cs.CV | Decomposing Disease Descriptions for Enhanced Pathology Detection: A Multi-Aspect Vision-Language Pre-training Framework はコメントを受け付けていません

HandBooster: Boosting 3D Hand-Mesh Reconstruction by Conditional Synthesis and Sampling of Hand-Object Interactions

要約 既存の実世界のデータセットには多様性がないため、単一の画像から 3D ハン … 続きを読む

カテゴリー: cs.CV | HandBooster: Boosting 3D Hand-Mesh Reconstruction by Conditional Synthesis and Sampling of Hand-Object Interactions はコメントを受け付けていません

Dual Structure-Aware Image Filterings for Semi-supervised Medical Image Segmentation

要約 半教師あり画像セグメンテーションは、最近大きな注目を集めています。 重要な … 続きを読む

カテゴリー: cs.CV | Dual Structure-Aware Image Filterings for Semi-supervised Medical Image Segmentation はコメントを受け付けていません

The Impact of Uniform Inputs on Activation Sparsity and Energy-Latency Attacks in Computer Vision

要約 現在、リソース効率は機械学習にとって重要な役割を果たしています。 エネルギ … 続きを読む

カテゴリー: cs.CR, cs.CV, cs.LG | The Impact of Uniform Inputs on Activation Sparsity and Energy-Latency Attacks in Computer Vision はコメントを受け付けていません

Users prefer Jpegli over same-sized libjpeg-turbo or MozJPEG

要約 MozJPEG、libjpeg-turbo、および新しい Jpegli エ … 続きを読む

カテゴリー: cs.CV, eess.IV, I.4.2 | Users prefer Jpegli over same-sized libjpeg-turbo or MozJPEG はコメントを受け付けていません

Homogeneous Tokenizer Matters: Homogeneous Visual Tokenizer for Remote Sensing Image Understanding

要約 トークナイザーは、大規模モデルの基本コンポーネントの 1 つとして、ビジュ … 続きを読む

カテゴリー: cs.AI, cs.CV | Homogeneous Tokenizer Matters: Homogeneous Visual Tokenizer for Remote Sensing Image Understanding はコメントを受け付けていません

RAP: Retrieval-Augmented Planner for Adaptive Procedure Planning in Instructional Videos

要約 教育ビデオでの手順計画には、初期状態と目標状態の視覚的観察に基づいて一連の … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | RAP: Retrieval-Augmented Planner for Adaptive Procedure Planning in Instructional Videos はコメントを受け付けていません

FlexEdit: Flexible and Controllable Diffusion-based Object-centric Image Editing

要約 私たちの取り組みは、形状の不一致による非現実的な結果や、オブジェクトの置換 … 続きを読む

カテゴリー: cs.CV | FlexEdit: Flexible and Controllable Diffusion-based Object-centric Image Editing はコメントを受け付けていません

Learning by Erasing: Conditional Entropy based Transferable Out-Of-Distribution Detection

要約 トレーニング シナリオとテスト シナリオの間の配布の変化に対処するには、配 … 続きを読む

カテゴリー: cs.CV | Learning by Erasing: Conditional Entropy based Transferable Out-Of-Distribution Detection はコメントを受け付けていません

Transformers-based architectures for stroke segmentation: A review

要約 脳卒中は依然として世界的な健康上の重大な懸念であり、タイムリーな介入と患者 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Transformers-based architectures for stroke segmentation: A review はコメントを受け付けていません