投稿者「jarxiv」のアーカイブ

SPECIAL: Zero-shot Hyperspectral Image Classification With CLIP

要約 Hyperspectral Image(HSI)分類は、HSIの各ピクセル … 続きを読む

カテゴリー: cs.CV | SPECIAL: Zero-shot Hyperspectral Image Classification With CLIP はコメントを受け付けていません

PDC-ViT : Source Camera Identification using Pixel Difference Convolution and Vision Transformer

要約 ソースカメラの識別は、テロ、暴力、その他の犯罪行為などの重要なケースを含む … 続きを読む

カテゴリー: cs.CV | PDC-ViT : Source Camera Identification using Pixel Difference Convolution and Vision Transformer はコメントを受け付けていません

Distilling foundation models for robust and efficient models in digital pathology

要約 近年、デジタル病理のための基礎モデル(FM)の出現は、トレーニング前のデー … 続きを読む

カテゴリー: 68T45, cs.CV, I.4.9 | Distilling foundation models for robust and efficient models in digital pathology はコメントを受け付けていません

From Dashcam Videos to Driving Simulations: Stress Testing Automated Vehicles against Rare Events

要約 現実的な運転シナリオを使用したシミュレーションで自動化された運転システム( … 続きを読む

カテゴリー: cs.AI, cs.CV | From Dashcam Videos to Driving Simulations: Stress Testing Automated Vehicles against Rare Events はコメントを受け付けていません

CLISC: Bridging clip and sam by enhanced cam for unsupervised brain tumor segmentation

要約 脳腫瘍のセグメンテーションは腫瘍の診断に重要であり、現在の深部学習方法は、 … 続きを読む

カテゴリー: cs.CV | CLISC: Bridging clip and sam by enhanced cam for unsupervised brain tumor segmentation はコメントを受け付けていません

Lightweight Weighted Average Ensemble Model for Pneumonia Detection in Chest X-Ray Images

要約 肺炎は、子供の病気と死の主な原因であり、早期かつ正確な検出の必要性を強調し … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | Lightweight Weighted Average Ensemble Model for Pneumonia Detection in Chest X-Ray Images はコメントを受け付けていません

Return of the Encoder: Maximizing Parameter Efficiency for SLMs

要約 大規模なデコーダーのみの言語モデルの優位性は、シーケンス処理における基本的 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Return of the Encoder: Maximizing Parameter Efficiency for SLMs はコメントを受け付けていません

2.5 Years in Class: A Multimodal Textbook for Vision-Language Pretraining

要約 画像テキストペアデータと比較して、インターリーブコーポラは、ビジョン言語モ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | 2.5 Years in Class: A Multimodal Textbook for Vision-Language Pretraining はコメントを受け付けていません

Brain-Adapter: Enhancing Neurological Disorder Analysis with Adapter-Tuning Multimodal Large Language Models

要約 脳障害を理解することは、正確な臨床診断と治療のために重要です。 マルチモー … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | Brain-Adapter: Enhancing Neurological Disorder Analysis with Adapter-Tuning Multimodal Large Language Models はコメントを受け付けていません

PEP-GS: Perceptually-Enhanced Precise Structured 3D Gaussians for View-Adaptive Rendering

要約 最近、3D Gaussian Splatting(3D-GS)は、リアルタ … 続きを読む

カテゴリー: cs.CV | PEP-GS: Perceptually-Enhanced Precise Structured 3D Gaussians for View-Adaptive Rendering はコメントを受け付けていません