月別アーカイブ: 2024年4月

DialogCC: An Automated Pipeline for Creating High-Quality Multi-Modal Dialogue Dataset

要約 インスタント メッセージで画像を共有することは重要な要素であるため、画像と … 続きを読む

カテゴリー: cs.CL, cs.CV | DialogCC: An Automated Pipeline for Creating High-Quality Multi-Modal Dialogue Dataset はコメントを受け付けていません

LifelongMemory: Leveraging LLMs for Answering Queries in Long-form Egocentric Videos

要約 この論文では、自然言語の質問応答と検索を通じて長文の自己中心的なビデオグラ … 続きを読む

カテゴリー: cs.CV, cs.LG | LifelongMemory: Leveraging LLMs for Answering Queries in Long-form Egocentric Videos はコメントを受け付けていません

Relation Rectification in Diffusion Model

要約 並外れた生成能力にもかかわらず、大規模なテキストから画像への拡散モデルは、 … 続きを読む

カテゴリー: cs.CV | Relation Rectification in Diffusion Model はコメントを受け付けていません

Descriptor and Word Soups: Overcoming the Parameter Efficiency Accuracy Tradeoff for Out-of-Distribution Few-shot Learning

要約 過去 1 年間にわたり、GPT 記述子を使用したゼロショット評価を中心とし … 続きを読む

カテゴリー: cs.CV | Descriptor and Word Soups: Overcoming the Parameter Efficiency Accuracy Tradeoff for Out-of-Distribution Few-shot Learning はコメントを受け付けていません

Latent Embedding Clustering for Occlusion Robust Head Pose Estimation

要約 頭姿勢推定は、ロボット工学、監視、ドライバーの注意監視などの幅広い用途で有 … 続きを読む

カテゴリー: cs.CV | Latent Embedding Clustering for Occlusion Robust Head Pose Estimation はコメントを受け付けていません

MedCLIP-SAM: Bridging Text and Image Towards Universal Medical Image Segmentation

要約 解剖学的構造と病理の医療画像セグメンテーションは、現代の臨床診断、疾患研究 … 続きを読む

カテゴリー: cs.CV, cs.LG | MedCLIP-SAM: Bridging Text and Image Towards Universal Medical Image Segmentation はコメントを受け付けていません

Benchmarking the Robustness of Temporal Action Detection Models Against Temporal Corruptions

要約 時間的アクション検出 (TAD) は、トリミングされていない長期間のビデオ … 続きを読む

カテゴリー: cs.CV | Benchmarking the Robustness of Temporal Action Detection Models Against Temporal Corruptions はコメントを受け付けていません

Prototype-based Interpretable Breast Cancer Prediction Models: Analysis and Challenges

要約 深層学習モデルは医療アプリケーションで高いパフォーマンスを実現していますが … 続きを読む

カテゴリー: cs.CV | Prototype-based Interpretable Breast Cancer Prediction Models: Analysis and Challenges はコメントを受け付けていません

EAGLE: Eigen Aggregation Learning for Object-Centric Unsupervised Semantic Segmentation

要約 セマンティック セグメンテーションは本質的に広範なピクセル レベルの注釈付 … 続きを読む

カテゴリー: cs.CV | EAGLE: Eigen Aggregation Learning for Object-Centric Unsupervised Semantic Segmentation はコメントを受け付けていません

Joint chest X-ray diagnosis and clinical visual attention prediction with multi-stage cooperative learning: enhancing interpretability

要約 ディープラーニングはコンピューター支援診断の最先端技術となっているため、臨 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Joint chest X-ray diagnosis and clinical visual attention prediction with multi-stage cooperative learning: enhancing interpretability はコメントを受け付けていません