「cs.CV」カテゴリーアーカイブ

CromSS: Cross-modal pre-training with noisy labels for remote sensing image segmentation

投稿日: 2025年3月4日作成者: jarxiv

要約我々は、地理空間アプリケーションのためのマルチモーダルフレームワーク内でセ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

GDTS: Goal-Guided Diffusion Model with Tree Sampling for Multi-Modal Pedestrian Trajectory Prediction

投稿日: 2025年3月4日作成者: jarxiv

要約歩行者の軌跡を正確に予測することは、自律走行の安全性を向上させるために極め … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

VoCo-LLaMA: Towards Vision Compression with Large Language Models

投稿日: 2025年3月4日作成者: jarxiv

要約視覚言語モデル(VLM)は、様々なマルチモーダルタスクにおいて目覚ましい成 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

HiBug2: Efficient and Interpretable Error Slice Discovery for Comprehensive Model Debugging

投稿日: 2025年3月4日作成者: jarxiv

要約コンピュータビジョンにおけるディープラーニングモデルの大きな成功にもかかわ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Saliency-Bench: A Comprehensive Benchmark for Evaluating Visual Explanations

投稿日: 2025年3月4日作成者: jarxiv

要約説明可能なAI（XAI）は、特に画像分類タスクにおいて、顕著性マップによっ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

EXACFS — A CIL Method to mitigate Catastrophic Forgetting

投稿日: 2025年3月4日作成者: jarxiv

要約ディープ・ニューラル・ネットワーク（DNNS）は、静的なデータセットからの … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Improving Representation of High-frequency Components for Medical Visual Foundation Models

投稿日: 2025年3月4日作成者: jarxiv

要約基礎モデルは、多様な下流タスクにまたがる優れた一般化可能性から、近年大きな … 続きを読む →

カテゴリー: cs.AI, cs.CV, eess.IV | コメントを受け付けていません

Slowing Down Forgetting in Continual Learning

投稿日: 2025年3月4日作成者: jarxiv

要約継続学習(CL)における一般的な課題は、新しいタスクを追加学習した後に古い … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

TRACE: Temporal Grounding Video LLM via Causal Event Modeling

投稿日: 2025年3月4日作成者: jarxiv

要約ビデオ時間接地（VTG）はビデオ理解モデルにとって重要な能力であり、ビデオ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Towards Training One-Step Diffusion Models Without Distillation

投稿日: 2025年3月4日作成者: jarxiv

要約ワンステップ生成モデルにおける最近の進歩は、通常2段階のプロセスに従ってい … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

CromSS: Cross-modal pre-training with noisy labels for remote sensing image segmentation

GDTS: Goal-Guided Diffusion Model with Tree Sampling for Multi-Modal Pedestrian Trajectory Prediction

VoCo-LLaMA: Towards Vision Compression with Large Language Models

HiBug2: Efficient and Interpretable Error Slice Discovery for Comprehensive Model Debugging

Saliency-Bench: A Comprehensive Benchmark for Evaluating Visual Explanations

EXACFS — A CIL Method to mitigate Catastrophic Forgetting

Improving Representation of High-frequency Components for Medical Visual Foundation Models

Slowing Down Forgetting in Continual Learning

TRACE: Temporal Grounding Video LLM via Causal Event Modeling

Towards Training One-Step Diffusion Models Without Distillation

最近の投稿

最近のコメント

アーカイブ

カテゴリー