cs.LG」カテゴリーアーカイブ

Training objective drives the consistency of representational similarity across datasets

要約 プラトニック表現仮説は、最近の基礎モデルが、これらのモデルのトレーニングに … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Training objective drives the consistency of representational similarity across datasets はコメントを受け付けていません

Open-set object detection: towards unified problem formulation and benchmarking

要約 自動運転など、信頼性が鍵となる現実のアプリケーションでは、トレーニング中に … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Open-set object detection: towards unified problem formulation and benchmarking はコメントを受け付けていません

Predicting Stroke through Retinal Graphs and Multimodal Self-supervised Learning

要約 脳卒中を早期に特定することは介入にとって非常に重要であり、信頼できるモデル … 続きを読む

カテゴリー: cs.CV, cs.LG | Predicting Stroke through Retinal Graphs and Multimodal Self-supervised Learning はコメントを受け付けていません

A Two-Step Concept-Based Approach for Enhanced Interpretability and Trust in Skin Lesion Diagnosis

要約 臨床現場での深層学習ベースのシステムの導入を妨げる主な課題は、注釈付きデー … 続きを読む

カテゴリー: cs.CV, cs.LG | A Two-Step Concept-Based Approach for Enhanced Interpretability and Trust in Skin Lesion Diagnosis はコメントを受け付けていません

Leveraging Bi-Focal Perspectives and Granular Feature Integration for Accurate Reliable Early Alzheimer’s Detection

要約 アルツハイマー病 (AD) は神経変性の最も一般的な形態であり、毎年何百万 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV, I.2.10 | Leveraging Bi-Focal Perspectives and Granular Feature Integration for Accurate Reliable Early Alzheimer’s Detection はコメントを受け付けていません

Video RWKV:Video Action Recognition Based RWKV

要約 CNN やトランスフォーマーなどの既存のビデオ理解方法における高い計算コス … 続きを読む

カテゴリー: cs.CV, cs.LG | Video RWKV:Video Action Recognition Based RWKV はコメントを受け付けていません

Online-LoRA: Task-free Online Continual Learning via Low Rank Adaptation

要約 壊滅的な忘却は、オンライン継続学習 (OCL) において、特にタスク境界が … 続きを読む

カテゴリー: cs.CV, cs.LG | Online-LoRA: Task-free Online Continual Learning via Low Rank Adaptation はコメントを受け付けていません

Tell What You Hear From What You See — Video to Audio Generation Through Text

要約 ビジュアル シーンとオーディオ シーンのコンテンツは多面的であり、ビデオと … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.SD, eess.AS | Tell What You Hear From What You See — Video to Audio Generation Through Text はコメントを受け付けていません

Visual-TCAV: Concept-based Attribution and Saliency Maps for Post-hoc Explainability in Image Classification

要約 畳み込みニューラル ネットワーク (CNN) は、近年、パフォーマンスが大 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Visual-TCAV: Concept-based Attribution and Saliency Maps for Post-hoc Explainability in Image Classification はコメントを受け付けていません

Scaling Laws for Task-Optimized Models of the Primate Visual Ventral Stream

要約 大規模な物体分類データセットでトレーニングされると、特定の人工ニューラル … 続きを読む

カテゴリー: cs.CV, cs.LG, q-bio.NC | Scaling Laws for Task-Optimized Models of the Primate Visual Ventral Stream はコメントを受け付けていません