cs.AI」カテゴリーアーカイブ

Robust Change Captioning in Remote Sensing: SECOND-CC Dataset and MModalCC Framework

要約 リモート センシング変化キャプション (RSICC) は、両時間画像間の変 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | Robust Change Captioning in Remote Sensing: SECOND-CC Dataset and MModalCC Framework はコメントを受け付けていません

VLSBench: Unveiling Visual Leakage in Multimodal Safety

要約 マルチモーダル大規模言語モデル (MLLM) の安全性に関する懸念は、さま … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.CV | VLSBench: Unveiling Visual Leakage in Multimodal Safety はコメントを受け付けていません

landmarker: a Toolkit for Anatomical Landmark Localization in 2D/3D Images

要約 2D/3D 画像における解剖学的ランドマークの位置特定は、医療画像処理にお … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | landmarker: a Toolkit for Anatomical Landmark Localization in 2D/3D Images はコメントを受け付けていません

Universal Actions for Enhanced Embodied Foundation Models

要約 多様なインターネット規模のデータでのトレーニングは、最近の大規模な基盤モデ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Universal Actions for Enhanced Embodied Foundation Models はコメントを受け付けていません

Tarsier2: Advancing Large Vision-Language Models from Detailed Video Description to Comprehensive Video Understanding

要約 Tarsier2 は、詳細かつ正確なビデオ説明を生成するために設計された最 … 続きを読む

カテゴリー: cs.AI, cs.CV | Tarsier2: Advancing Large Vision-Language Models from Detailed Video Description to Comprehensive Video Understanding はコメントを受け付けていません

Spatio-temporal Graph Learning on Adaptive Mined Key Frames for High-performance Multi-Object Tracking

要約 マルチオブジェクト追跡の領域では、ビデオ シーケンス内のオブジェクト間の空 … 続きを読む

カテゴリー: cs.AI, cs.CV | Spatio-temporal Graph Learning on Adaptive Mined Key Frames for High-performance Multi-Object Tracking はコメントを受け付けていません

Generate E-commerce Product Background by Integrating Category Commonality and Personalized Style

要約 電子商取引の製品背景を生成する最先端の方法は、制作をスケールアップする際に … 続きを読む

カテゴリー: cs.AI, cs.CV | Generate E-commerce Product Background by Integrating Category Commonality and Personalized Style はコメントを受け付けていません

Deep Compression Autoencoder for Efficient High-Resolution Diffusion Models

要約 高解像度拡散モデルを加速するための新しいオートエンコーダー モデル ファミ … 続きを読む

カテゴリー: cs.AI, cs.CV | Deep Compression Autoencoder for Efficient High-Resolution Diffusion Models はコメントを受け付けていません

Bridging Diversity and Uncertainty in Active learning with Self-Supervised Pre-Training

要約 この研究は、特に自己教師付き事前トレーニング済みモデルのコンテキスト内での … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Bridging Diversity and Uncertainty in Active learning with Self-Supervised Pre-Training はコメントを受け付けていません

3rd Workshop on Maritime Computer Vision (MaCVi) 2025: Challenge Results

要約 2025 年海洋コンピュータ ビジョン (MaCVi) に関する第 3 回 … 続きを読む

カテゴリー: cs.AI, cs.CV | 3rd Workshop on Maritime Computer Vision (MaCVi) 2025: Challenge Results はコメントを受け付けていません