cs.AI」カテゴリーアーカイブ

The Linear Attention Resurrection in Vision Transformer

要約 Vision Transformers(VITS)は最近、コンピュータービ … 続きを読む

カテゴリー: cs.AI, cs.CV | The Linear Attention Resurrection in Vision Transformer はコメントを受け付けていません

MoColl: Agent-Based Specific and General Model Collaboration for Image Captioning

要約 画像キャプションは、コンピュータービジョンと自然言語処理の交差点における重 … 続きを読む

カテゴリー: cs.AI, cs.CV | MoColl: Agent-Based Specific and General Model Collaboration for Image Captioning はコメントを受け付けていません

UDBE: Unsupervised Diffusion-based Brightness Enhancement in Underwater Images

要約 水中環境でのアクティビティは、いくつかのシナリオで最も重要であり、水中画像 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | UDBE: Unsupervised Diffusion-based Brightness Enhancement in Underwater Images はコメントを受け付けていません

From Dashcam Videos to Driving Simulations: Stress Testing Automated Vehicles against Rare Events

要約 現実的な運転シナリオを使用したシミュレーションで自動化された運転システム( … 続きを読む

カテゴリー: cs.AI, cs.CV | From Dashcam Videos to Driving Simulations: Stress Testing Automated Vehicles against Rare Events はコメントを受け付けていません

Lightweight Weighted Average Ensemble Model for Pneumonia Detection in Chest X-Ray Images

要約 肺炎は、子供の病気と死の主な原因であり、早期かつ正確な検出の必要性を強調し … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | Lightweight Weighted Average Ensemble Model for Pneumonia Detection in Chest X-Ray Images はコメントを受け付けていません

Return of the Encoder: Maximizing Parameter Efficiency for SLMs

要約 大規模なデコーダーのみの言語モデルの優位性は、シーケンス処理における基本的 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Return of the Encoder: Maximizing Parameter Efficiency for SLMs はコメントを受け付けていません

Brain-Adapter: Enhancing Neurological Disorder Analysis with Adapter-Tuning Multimodal Large Language Models

要約 脳障害を理解することは、正確な臨床診断と治療のために重要です。 マルチモー … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | Brain-Adapter: Enhancing Neurological Disorder Analysis with Adapter-Tuning Multimodal Large Language Models はコメントを受け付けていません

Mixture-of-Mamba: Enhancing Multi-Modal State-Space Models with Modality-Aware Sparsity

要約 状態空間モデル(SSM)は、シーケンシャルモデリングのための変圧器の効率的 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Mixture-of-Mamba: Enhancing Multi-Modal State-Space Models with Modality-Aware Sparsity はコメントを受け付けていません

Large Models in Dialogue for Active Perception and Anomaly Detection

要約 自律航空監視は、人間が簡単にアクセスできない地域から情報を収集することを目 … 続きを読む

カテゴリー: cs.AI, cs.CV | Large Models in Dialogue for Active Perception and Anomaly Detection はコメントを受け付けていません

MedPromptX: Grounded Multimodal Prompting for Chest X-ray Diagnosis

要約 胸部X線画像は、一般的に急性および慢性の心肺状態を予測するために使用されま … 続きを読む

カテゴリー: cs.AI, cs.CV | MedPromptX: Grounded Multimodal Prompting for Chest X-ray Diagnosis はコメントを受け付けていません