月別アーカイブ: 2025年1月

Cracks in concrete

要約 コンクリートの画像の亀裂を見つけて適切にセグメント化することは、困難な作業 … 続きを読む

カテゴリー: 60D05, cs.CV, eess.IV, stat.AP | コメントする

Dual Thinking and Logical Processing — Are Multi-modal Large Language Models Closing the Gap with Human Vision ?

要約 デュアル思考フレームワークでは、高速で直感的な処理と遅い論理処理を考慮しま … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | コメントする

©Plug-in Authorization for Human Content Copyright Protection in Text-to-Image Model

要約 このペーパーでは、テキストからイメージのモデルによって生成された画像の著作 … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.CV, cs.LG | コメントする

MatIR: A Hybrid Mamba-Transformer Image Restoration Model

要約 近年、トランスベースのモデルは、複雑なコンテキスト機能をキャプチャする固有 … 続きを読む

カテゴリー: cs.CV | コメントする

Efficient Transformer for High Resolution Image Motion Deblurring

要約 このペーパーでは、高解像度の画像モーションの脱毛のための包括的な研究とRE … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

PV-S3: Advancing Automatic Photovoltaic Defect Detection using Semi-Supervised Semantic Segmentation of Electroluminescence Images

要約 太陽光発電(PV)システムにより、すべての豊富な太陽エネルギーを活用するこ … 続きを読む

カテゴリー: cs.CV, eess.IV | コメントする

DreamArtist++: Controllable One-Shot Text-to-Image Generation via Positive-Negative Adapter

要約 Imagenや安定した拡散モデルなどの最先端のテキストからイメージからイメ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.MM | コメントする

Task-based Regularization in Penalized Least-Squares for Binary Signal Detection Tasks in Medical Image Denoising

要約 画像除去アルゴリズムは、医療イメージングについて広範囲に調査されています。 … 続きを読む

カテゴリー: cs.CV, eess.IV | コメントする

SANA 1.5: Efficient Scaling of Training-Time and Inference-Time Compute in Linear Diffusion Transformer

要約 このホワイトペーパーでは、テキストからイメージの生成において効率的なスケー … 続きを読む

カテゴリー: cs.CV | コメントする

Advancing the Understanding and Evaluation of AR-Generated Scenes: When Vision-Language Models Shine and Stumble

要約 拡張現実(AR)は、仮想コンテンツを統合することにより現実の世界を強化しま … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.HC | コメントする