投稿者「jarxiv」のアーカイブ

A Foundation Language-Image Model of the Retina (FLAIR): Encoding Expert Knowledge in Text Supervision

要約 財団のビジョン言語モデルは現在、コンピューター ビジョンを変革しており、そ … 続きを読む

カテゴリー: cs.CV | コメントする

Lights, Camera, Matching: The Role of Image Illumination in Fair Face Recognition

要約 顔の明るさは、人口統計グループ間の顔認識精度の差に影響を与える重要な画質要 … 続きを読む

カテゴリー: cs.CV | コメントする

Empowering Agricultural Insights: RiceLeafBD – A Novel Dataset and Optimal Model Selection for Rice Leaf Disease Diagnosis through Transfer Learning Technique

要約 豊かな緑に囲まれたこの農業国に住む人口は日々増加しています。 その結果、住 … 続きを読む

カテゴリー: cs.CV | コメントする

Learning Joint Denoising, Demosaicing, and Compression from the Raw Natural Image Noise Dataset

要約 このペーパーでは、センサー、画像開発ワークフロー、およびスタイル全体で一般 … 続きを読む

カテゴリー: 68U10, cs.CV, eess.IV, I.2.10 | コメントする

Visual WetlandBirds Dataset: Bird Species Identification and Behavior Recognition in Videos

要約 現在の生物多様性損失の危機により、動物のモニタリングが関連する研究分野とな … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

TextSleuth: Towards Explainable Tampered Text Detection

要約 最近、改ざんテキストの検出は、情報セキュリティにおける重要な役割によります … 続きを読む

カテゴリー: cs.CV | コメントする

PACE: Marrying generalization in PArameter-efficient fine-tuning with Consistency rEgularization

要約 Parameter-Efficient Fine-Tuning (PEFT … 続きを読む

カテゴリー: cs.CV, cs.LG | コメントする

Identifying Spurious Correlations using Counterfactual Alignment

要約 偽の相関によって駆動されるモデルでは、汎化パフォーマンスが劣ることがよくあ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | コメントする

An analysis of data variation and bias in image-based dermatological datasets for machine learning classification

要約 AI アルゴリズムは、医療専門家を支援する上で貴重なものとなっています。 … 続きを読む

カテゴリー: cs.AI, cs.CV, I.5.4 | コメントする

Compression with Global Guidance: Towards Training-free High-Resolution MLLMs Acceleration

要約 マルチモーダル大規模言語モデル (MLLM) は、視覚的なコンテンツの理解 … 続きを読む

カテゴリー: cs.CV | コメントする