月別アーカイブ: 2025年1月

Distilling foundation models for robust and efficient models in digital pathology

要約 近年、デジタル病理のための基礎モデル(FM)の出現は、トレーニング前のデー … 続きを読む

カテゴリー: 68T45, cs.CV, I.4.9 | Distilling foundation models for robust and efficient models in digital pathology はコメントを受け付けていません

From Dashcam Videos to Driving Simulations: Stress Testing Automated Vehicles against Rare Events

要約 現実的な運転シナリオを使用したシミュレーションで自動化された運転システム( … 続きを読む

カテゴリー: cs.AI, cs.CV | From Dashcam Videos to Driving Simulations: Stress Testing Automated Vehicles against Rare Events はコメントを受け付けていません

CLISC: Bridging clip and sam by enhanced cam for unsupervised brain tumor segmentation

要約 脳腫瘍のセグメンテーションは腫瘍の診断に重要であり、現在の深部学習方法は、 … 続きを読む

カテゴリー: cs.CV | CLISC: Bridging clip and sam by enhanced cam for unsupervised brain tumor segmentation はコメントを受け付けていません

Lightweight Weighted Average Ensemble Model for Pneumonia Detection in Chest X-Ray Images

要約 肺炎は、子供の病気と死の主な原因であり、早期かつ正確な検出の必要性を強調し … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | Lightweight Weighted Average Ensemble Model for Pneumonia Detection in Chest X-Ray Images はコメントを受け付けていません

Return of the Encoder: Maximizing Parameter Efficiency for SLMs

要約 大規模なデコーダーのみの言語モデルの優位性は、シーケンス処理における基本的 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Return of the Encoder: Maximizing Parameter Efficiency for SLMs はコメントを受け付けていません

2.5 Years in Class: A Multimodal Textbook for Vision-Language Pretraining

要約 画像テキストペアデータと比較して、インターリーブコーポラは、ビジョン言語モ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | 2.5 Years in Class: A Multimodal Textbook for Vision-Language Pretraining はコメントを受け付けていません

Brain-Adapter: Enhancing Neurological Disorder Analysis with Adapter-Tuning Multimodal Large Language Models

要約 脳障害を理解することは、正確な臨床診断と治療のために重要です。 マルチモー … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | Brain-Adapter: Enhancing Neurological Disorder Analysis with Adapter-Tuning Multimodal Large Language Models はコメントを受け付けていません

PEP-GS: Perceptually-Enhanced Precise Structured 3D Gaussians for View-Adaptive Rendering

要約 最近、3D Gaussian Splatting(3D-GS)は、リアルタ … 続きを読む

カテゴリー: cs.CV | PEP-GS: Perceptually-Enhanced Precise Structured 3D Gaussians for View-Adaptive Rendering はコメントを受け付けていません

Multi-view Structural Convolution Network for Domain-Invariant Point Cloud Recognition of Autonomous Vehicles

要約 ポイントクラウドの表現は最近、コンピュータービジョンの分野での研究ホットス … 続きを読む

カテゴリー: cs.CV | Multi-view Structural Convolution Network for Domain-Invariant Point Cloud Recognition of Autonomous Vehicles はコメントを受け付けていません

Mixture-of-Mamba: Enhancing Multi-Modal State-Space Models with Modality-Aware Sparsity

要約 状態空間モデル(SSM)は、シーケンシャルモデリングのための変圧器の効率的 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Mixture-of-Mamba: Enhancing Multi-Modal State-Space Models with Modality-Aware Sparsity はコメントを受け付けていません