cs.CV」カテゴリーアーカイブ

CromSS: Cross-modal pre-training with noisy labels for remote sensing image segmentation

要約 我々は、地理空間アプリケーションのためのマルチモーダルフレームワーク内でセ … 続きを読む

カテゴリー: cs.CV | CromSS: Cross-modal pre-training with noisy labels for remote sensing image segmentation はコメントを受け付けていません

GDTS: Goal-Guided Diffusion Model with Tree Sampling for Multi-Modal Pedestrian Trajectory Prediction

要約 歩行者の軌跡を正確に予測することは、自律走行の安全性を向上させるために極め … 続きを読む

カテゴリー: cs.CV | GDTS: Goal-Guided Diffusion Model with Tree Sampling for Multi-Modal Pedestrian Trajectory Prediction はコメントを受け付けていません

VoCo-LLaMA: Towards Vision Compression with Large Language Models

要約 視覚言語モデル(VLM)は、様々なマルチモーダルタスクにおいて目覚ましい成 … 続きを読む

カテゴリー: cs.CV | VoCo-LLaMA: Towards Vision Compression with Large Language Models はコメントを受け付けていません

HiBug2: Efficient and Interpretable Error Slice Discovery for Comprehensive Model Debugging

要約 コンピュータビジョンにおけるディープラーニングモデルの大きな成功にもかかわ … 続きを読む

カテゴリー: cs.AI, cs.CV | HiBug2: Efficient and Interpretable Error Slice Discovery for Comprehensive Model Debugging はコメントを受け付けていません

Saliency-Bench: A Comprehensive Benchmark for Evaluating Visual Explanations

要約 説明可能なAI(XAI)は、特に画像分類タスクにおいて、顕著性マップによっ … 続きを読む

カテゴリー: cs.CV | Saliency-Bench: A Comprehensive Benchmark for Evaluating Visual Explanations はコメントを受け付けていません

EXACFS — A CIL Method to mitigate Catastrophic Forgetting

要約 ディープ・ニューラル・ネットワーク(DNNS)は、静的なデータセットからの … 続きを読む

カテゴリー: cs.CV, cs.LG | EXACFS — A CIL Method to mitigate Catastrophic Forgetting はコメントを受け付けていません

Improving Representation of High-frequency Components for Medical Visual Foundation Models

要約 基礎モデルは、多様な下流タスクにまたがる優れた一般化可能性から、近年大きな … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | Improving Representation of High-frequency Components for Medical Visual Foundation Models はコメントを受け付けていません

Slowing Down Forgetting in Continual Learning

要約 継続学習(CL)における一般的な課題は、新しいタスクを追加学習した後に古い … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Slowing Down Forgetting in Continual Learning はコメントを受け付けていません

TRACE: Temporal Grounding Video LLM via Causal Event Modeling

要約 ビデオ時間接地(VTG)はビデオ理解モデルにとって重要な能力であり、ビデオ … 続きを読む

カテゴリー: cs.CV | TRACE: Temporal Grounding Video LLM via Causal Event Modeling はコメントを受け付けていません

Towards Training One-Step Diffusion Models Without Distillation

要約 ワンステップ生成モデルにおける最近の進歩は、通常2段階のプロセスに従ってい … 続きを読む

カテゴリー: cs.CV, cs.LG | Towards Training One-Step Diffusion Models Without Distillation はコメントを受け付けていません