cs.CV」カテゴリーアーカイブ

KaLDeX: Kalman Filter based Linear Deformable Cross Attention for Retina Vessel Segmentation

要約 背景と目的: 眼科画像処理の分野では、さまざまな眼疾患の診断と管理には正確 … 続きを読む

カテゴリー: cs.CV, eess.IV | KaLDeX: Kalman Filter based Linear Deformable Cross Attention for Retina Vessel Segmentation はコメントを受け付けていません

Toward Open Vocabulary Aerial Object Detection with CLIP-Activated Student-Teacher Learning

要約 リモート センシング画像の数がますます増えているため、コストをかけて新たに … 続きを読む

カテゴリー: cs.CV | Toward Open Vocabulary Aerial Object Detection with CLIP-Activated Student-Teacher Learning はコメントを受け付けていません

Document Parsing Unveiled: Techniques, Challenges, and Prospects for Structured Information Extraction

要約 文書解析は、契約書、学術論文、請求書などの非構造化文書および半構造化文書を … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | Document Parsing Unveiled: Techniques, Challenges, and Prospects for Structured Information Extraction はコメントを受け付けていません

Joint Audio-Visual Idling Vehicle Detection with Streamlined Input Dependencies

要約 アイドリング車両検出 (IVD) は、不必要なアイドリングを監視して削減す … 続きを読む

カテゴリー: cs.CV | Joint Audio-Visual Idling Vehicle Detection with Streamlined Input Dependencies はコメントを受け付けていません

Deep Learning-Based Fatigue Cracks Detection in Bridge Girders using Feature Pyramid Networks

要約 構造健全性モニタリングでは、継続的かつ自動で亀裂を検出することが困難な問題 … 続きを読む

カテゴリー: cs.AI, cs.CV | Deep Learning-Based Fatigue Cracks Detection in Bridge Girders using Feature Pyramid Networks はコメントを受け付けていません

Immunohistochemistry guided segmentation of benign epithelial cells, in situ lesions, and invasive epithelial cells in breast cancer slides

要約 デジタルパソロジーでは、人工知能 (AI) を使用した病理組織切片の自動分 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV, I.4.6 | Immunohistochemistry guided segmentation of benign epithelial cells, in situ lesions, and invasive epithelial cells in breast cancer slides はコメントを受け付けていません

Aligning Text-to-Image Diffusion Models with Reward Backpropagation

要約 テキストから画像への拡散モデルは、非常に大規模な教師なしまたは弱く教師付き … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Aligning Text-to-Image Diffusion Models with Reward Backpropagation はコメントを受け付けていません

SAM 2: Segment Anything in Images and Videos

要約 私たちは、画像やビデオの視覚的なセグメンテーションを迅速に解決するための基 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | SAM 2: Segment Anything in Images and Videos はコメントを受け付けていません

Exploring contextual modeling with linear complexity for point cloud segmentation

要約 点群セグメンテーションは 3D 理解における重要なトピックであり、従来は … 続きを読む

カテゴリー: cs.CV | Exploring contextual modeling with linear complexity for point cloud segmentation はコメントを受け付けていません

Customizing Text-to-Image Models with a Single Image Pair

要約 アートの再解釈とは、参照作品のバリエーションを作成し、独特の芸術的スタイル … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.LG | Customizing Text-to-Image Models with a Single Image Pair はコメントを受け付けていません