月別アーカイブ: 2025年1月

Mamba2D: A Natively Multi-Dimensional State-Space Model for Vision Tasks

要約 状態空間モデル (SSM) は、長年のトランスフォーマー アーキテクチャに … 続きを読む

カテゴリー: cs.CV | Mamba2D: A Natively Multi-Dimensional State-Space Model for Vision Tasks はコメントを受け付けていません

Continuous Urban Change Detection from Satellite Image Time Series with Temporal Feature Refinement and Multi-Task Integration

要約 都市化は前例のない速度で進み、その結果、環境と人間の幸福に悪影響を及ぼしま … 続きを読む

カテゴリー: cs.CV | Continuous Urban Change Detection from Satellite Image Time Series with Temporal Feature Refinement and Multi-Task Integration はコメントを受け付けていません

Tarsier2: Advancing Large Vision-Language Models from Detailed Video Description to Comprehensive Video Understanding

要約 Tarsier2 は、詳細かつ正確なビデオ説明を生成するために設計された最 … 続きを読む

カテゴリー: cs.AI, cs.CV | Tarsier2: Advancing Large Vision-Language Models from Detailed Video Description to Comprehensive Video Understanding はコメントを受け付けていません

Expression Prompt Collaboration Transformer for Universal Referring Video Object Segmentation

要約 音声ガイド付きビデオ オブジェクト セグメンテーション (A-VOS) と … 続きを読む

カテゴリー: cs.CV, eess.AS, eess.IV | Expression Prompt Collaboration Transformer for Universal Referring Video Object Segmentation はコメントを受け付けていません

FECT: Classification of Breast Cancer Pathological Images Based on Fusion Features

要約 乳がんは世界中の女性の間で最も一般的ながんの 1 つであり、早期診断と正確 … 続きを読む

カテゴリー: cs.CV, eess.IV | FECT: Classification of Breast Cancer Pathological Images Based on Fusion Features はコメントを受け付けていません

Spatio-temporal Graph Learning on Adaptive Mined Key Frames for High-performance Multi-Object Tracking

要約 マルチオブジェクト追跡の領域では、ビデオ シーケンス内のオブジェクト間の空 … 続きを読む

カテゴリー: cs.AI, cs.CV | Spatio-temporal Graph Learning on Adaptive Mined Key Frames for High-performance Multi-Object Tracking はコメントを受け付けていません

ACE: Anatomically Consistent Embeddings in Composition and Decomposition

要約 標準化されたプロトコルから取得された医用画像は、一貫した巨視的または微視的 … 続きを読む

カテゴリー: cs.CV | ACE: Anatomically Consistent Embeddings in Composition and Decomposition はコメントを受け付けていません

Isolated Diffusion: Optimizing Multi-Concept Text-to-Image Generation Training-Freely with Isolated Diffusion Guidance

要約 大規模なテキストから画像への拡散モデルは、ターゲット テキスト プロンプト … 続きを読む

カテゴリー: cs.CV | Isolated Diffusion: Optimizing Multi-Concept Text-to-Image Generation Training-Freely with Isolated Diffusion Guidance はコメントを受け付けていません

A Survey on Deep Learning for Polyp Segmentation: Techniques, Challenges and Future Trends

要約 ポリープの早期検出と評価は、結腸直腸がん (CRC) の予防と治療において … 続きを読む

カテゴリー: cs.CV | A Survey on Deep Learning for Polyp Segmentation: Techniques, Challenges and Future Trends はコメントを受け付けていません

A Vision-Language Framework for Multispectral Scene Representation Using Language-Grounded Features

要約 リモート センシングにおけるシーンの理解は、雪、雲、霧も含まれる可能性のあ … 続きを読む

カテゴリー: cs.CV | A Vision-Language Framework for Multispectral Scene Representation Using Language-Grounded Features はコメントを受け付けていません