cs.CV」カテゴリーアーカイブ

Universal Actions for Enhanced Embodied Foundation Models

要約 多様なインターネット規模のデータでのトレーニングは、最近の大規模な基盤モデ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Universal Actions for Enhanced Embodied Foundation Models はコメントを受け付けていません

DiffVSR: Enhancing Real-World Video Super-Resolution with Diffusion Models for Advanced Visual Quality and Temporal Consistency

要約 拡散モデルは、画像の生成と復元において優れた機能を実証してきましたが、ビデ … 続きを読む

カテゴリー: cs.CV | DiffVSR: Enhancing Real-World Video Super-Resolution with Diffusion Models for Advanced Visual Quality and Temporal Consistency はコメントを受け付けていません

Mamba2D: A Natively Multi-Dimensional State-Space Model for Vision Tasks

要約 状態空間モデル (SSM) は、長年のトランスフォーマー アーキテクチャに … 続きを読む

カテゴリー: cs.CV | Mamba2D: A Natively Multi-Dimensional State-Space Model for Vision Tasks はコメントを受け付けていません

Continuous Urban Change Detection from Satellite Image Time Series with Temporal Feature Refinement and Multi-Task Integration

要約 都市化は前例のない速度で進み、その結果、環境と人間の幸福に悪影響を及ぼしま … 続きを読む

カテゴリー: cs.CV | Continuous Urban Change Detection from Satellite Image Time Series with Temporal Feature Refinement and Multi-Task Integration はコメントを受け付けていません

Tarsier2: Advancing Large Vision-Language Models from Detailed Video Description to Comprehensive Video Understanding

要約 Tarsier2 は、詳細かつ正確なビデオ説明を生成するために設計された最 … 続きを読む

カテゴリー: cs.AI, cs.CV | Tarsier2: Advancing Large Vision-Language Models from Detailed Video Description to Comprehensive Video Understanding はコメントを受け付けていません

Expression Prompt Collaboration Transformer for Universal Referring Video Object Segmentation

要約 音声ガイド付きビデオ オブジェクト セグメンテーション (A-VOS) と … 続きを読む

カテゴリー: cs.CV, eess.AS, eess.IV | Expression Prompt Collaboration Transformer for Universal Referring Video Object Segmentation はコメントを受け付けていません

FECT: Classification of Breast Cancer Pathological Images Based on Fusion Features

要約 乳がんは世界中の女性の間で最も一般的ながんの 1 つであり、早期診断と正確 … 続きを読む

カテゴリー: cs.CV, eess.IV | FECT: Classification of Breast Cancer Pathological Images Based on Fusion Features はコメントを受け付けていません

Spatio-temporal Graph Learning on Adaptive Mined Key Frames for High-performance Multi-Object Tracking

要約 マルチオブジェクト追跡の領域では、ビデオ シーケンス内のオブジェクト間の空 … 続きを読む

カテゴリー: cs.AI, cs.CV | Spatio-temporal Graph Learning on Adaptive Mined Key Frames for High-performance Multi-Object Tracking はコメントを受け付けていません

ACE: Anatomically Consistent Embeddings in Composition and Decomposition

要約 標準化されたプロトコルから取得された医用画像は、一貫した巨視的または微視的 … 続きを読む

カテゴリー: cs.CV | ACE: Anatomically Consistent Embeddings in Composition and Decomposition はコメントを受け付けていません

Isolated Diffusion: Optimizing Multi-Concept Text-to-Image Generation Training-Freely with Isolated Diffusion Guidance

要約 大規模なテキストから画像への拡散モデルは、ターゲット テキスト プロンプト … 続きを読む

カテゴリー: cs.CV | Isolated Diffusion: Optimizing Multi-Concept Text-to-Image Generation Training-Freely with Isolated Diffusion Guidance はコメントを受け付けていません