cs.CV」カテゴリーアーカイブ

Beyond Pixels: Text Enhances Generalization in Real-World Image Restoration

要約 一般化は、実世界の画像復元において長い間中心的な課題でした。 テキストから … 続きを読む

カテゴリー: cs.CV | Beyond Pixels: Text Enhances Generalization in Real-World Image Restoration はコメントを受け付けていません

Understanding Multi-Granularity for Open-Vocabulary Part Segmentation

要約 オープン語彙部分セグメンテーション (OVPS) は、これまで見たことのな … 続きを読む

カテゴリー: cs.CV | Understanding Multi-Granularity for Open-Vocabulary Part Segmentation はコメントを受け付けていません

Archaeoscape: Bringing Aerial Laser Scanning Archaeology to the Deep Learning Era

要約 航空機レーザー スキャン (ALS) テクノロジーは、密集した植生の下に隠 … 続きを読む

カテゴリー: cs.AI, cs.CV | Archaeoscape: Bringing Aerial Laser Scanning Archaeology to the Deep Learning Era はコメントを受け付けていません

ColonNet: A Hybrid Of DenseNet121 And U-NET Model For Detection And Segmentation Of GI Bleeding

要約 この研究では、ワイヤレス カプセル内視鏡 (WCE) ビデオから抽出された … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | ColonNet: A Hybrid Of DenseNet121 And U-NET Model For Detection And Segmentation Of GI Bleeding はコメントを受け付けていません

Aesthetic Post-Training Diffusion Models from Generic Preferences with Step-by-step Preference Optimization

要約 視覚的に魅力的な画像を生成することは、最新のテキストから画像への生成モデル … 続きを読む

カテゴリー: cs.CV | Aesthetic Post-Training Diffusion Models from Generic Preferences with Step-by-step Preference Optimization はコメントを受け付けていません

MAmmoTH-VL: Eliciting Multimodal Reasoning with Instruction Tuning at Scale

要約 オープンソースのマルチモーダル大規模言語モデル (MLLM) は、幅広いマ … 続きを読む

カテゴリー: cs.CL, cs.CV | MAmmoTH-VL: Eliciting Multimodal Reasoning with Instruction Tuning at Scale はコメントを受け付けていません

FairMedFM: Fairness Benchmarking for Medical Imaging Foundation Models

要約 医療における基礎モデル (FM) の出現により、自動化された分類およびセグ … 続きを読む

カテゴリー: cs.CV | FairMedFM: Fairness Benchmarking for Medical Imaging Foundation Models はコメントを受け付けていません

A Practitioner’s Guide to Continual Multimodal Pretraining

要約 マルチモーダル基盤モデルは、視覚と言語の交差点で数多くのアプリケーションに … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | A Practitioner’s Guide to Continual Multimodal Pretraining はコメントを受け付けていません

CompCap: Improving Multimodal Large Language Models with Composite Captions

要約 マルチモーダル大規模言語モデル (MLLM) は合成画像をどの程度理解でき … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | CompCap: Improving Multimodal Large Language Models with Composite Captions はコメントを受け付けていません

From classical techniques to convolution-based models: A review of object detection algorithms

要約 オブジェクト検出は、コンピューター ビジョンと画像理解における基本的なタス … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | From classical techniques to convolution-based models: A review of object detection algorithms はコメントを受け付けていません