投稿者「jarxiv」のアーカイブ

Regularized Personalization of Text-to-Image Diffusion Models without Distributional Drift

投稿日: 2025年5月28日作成者: jarxiv

要約テキストから画像への拡散モデルを使用したパーソナライズには、少数の画像例を … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Beyond Accuracy: Uncovering the Role of Similarity Perception and its Alignment with Semantics in Supervised Learning

投稿日: 2025年5月28日作成者: jarxiv

要約類似性は、特に重要なセマンティックな類似性を含むさまざまな形で現れ、例えば … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Cognitive Disentanglement for Referring Multi-Object Tracking

投稿日: 2025年5月28日作成者: jarxiv

要約インテリジェント輸送知覚システムにおけるマルチソース情報融合の重要なアプリ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Prostate Cancer Screening with Artificial Intelligence-Enhanced Micro-Ultrasound: A Comparative Study with Traditional Methods

投稿日: 2025年5月28日作成者: jarxiv

要約背景と目的：Micro-Ultrasound（Micro-US）は、臨床的 … 続きを読む →

カテゴリー: cs.AI, cs.CV, eess.IV | コメントを受け付けていません

AgriFM: A Multi-source Temporal Remote Sensing Foundation Model for Crop Mapping

投稿日: 2025年5月28日作成者: jarxiv

要約正確な作物マッピングは、個々のフィールドテクスチャから景観レベルのコンテキ … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Envisioning Beyond the Pixels: Benchmarking Reasoning-Informed Visual Editing

投稿日: 2025年5月28日作成者: jarxiv

要約大規模なマルチモダリティモデル（LMM）は、視覚的理解と生成に大きな進歩を … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

YOLO-SPCI: Enhancing Remote Sensing Object Detection via Selective-Perspective-Class Integration

投稿日: 2025年5月28日作成者: jarxiv

要約リモートセンシング画像のオブジェクト検出は、極端なスケールの変動、密なオブ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Chain-of-Zoom: Extreme Super-Resolution via Scale Autoregression and Preference Alignment

投稿日: 2025年5月28日作成者: jarxiv

要約最新のシングルイメージスーパー解像度（SISR）モデルは、訓練されているス … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

OrionBench: A Benchmark for Chart and Human-Recognizable Object Detection in Infographics

投稿日: 2025年5月28日作成者: jarxiv

要約科学、ビジネス、およびコミュニケーションのコンテキストにおけるチャートの中 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

Video-Holmes: Can MLLM Think Like Holmes for Complex Video Reasoning?

投稿日: 2025年5月28日作成者: jarxiv

要約 COTの推論とトレーニング後のRLの最近の進歩は、MLLMのビデオ推論機能 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

投稿者「jarxiv」のアーカイブ

Regularized Personalization of Text-to-Image Diffusion Models without Distributional Drift

Beyond Accuracy: Uncovering the Role of Similarity Perception and its Alignment with Semantics in Supervised Learning

Cognitive Disentanglement for Referring Multi-Object Tracking

Prostate Cancer Screening with Artificial Intelligence-Enhanced Micro-Ultrasound: A Comparative Study with Traditional Methods

AgriFM: A Multi-source Temporal Remote Sensing Foundation Model for Crop Mapping

Envisioning Beyond the Pixels: Benchmarking Reasoning-Informed Visual Editing

YOLO-SPCI: Enhancing Remote Sensing Object Detection via Selective-Perspective-Class Integration

Chain-of-Zoom: Extreme Super-Resolution via Scale Autoregression and Preference Alignment

OrionBench: A Benchmark for Chart and Human-Recognizable Object Detection in Infographics

Video-Holmes: Can MLLM Think Like Holmes for Complex Video Reasoning?

最近の投稿

最近のコメント

アーカイブ

カテゴリー