cs.CV」カテゴリーアーカイブ

STAA-SNN: Spatial-Temporal Attention Aggregator for Spiking Neural Networks

要約 スパイクニューラルネットワーク(SNN)は、生物学的妥当性とエネルギー効率 … 続きを読む

カテゴリー: cs.CV | コメントする

Memory Efficient Continual Learning for Edge-Based Visual Anomaly Detection

要約 視覚異常検出(VAD)は、多数の現実世界のアプリケーションを備えたコンピュ … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

WalkVLM:Aid Visually Impaired People Walking by Vision Language Model

要約 世界中の約2億人の個人が視覚障害の程度がさまざまであるため、AIテクノロジ … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

A Comprehensive Survey on Composed Image Retrieval

要約 Composed Image Retrieval(CIR)は、ユーザーが参 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.IR, cs.MM | コメントする

HarmonySet: A Comprehensive Dataset for Understanding Video-Music Semantic Alignment and Temporal Synchronization

要約 このペーパーでは、ビデオ音楽の理解を進めるために設計された包括的なデータセ … 続きを読む

カテゴリー: cs.CV | コメントする

Catheter Detection and Segmentation in X-ray Images via Multi-task Learning

要約 X線蛍光視鏡画像のカテーテルやワイヤなどの手術装置の自動検出とセグメンテー … 続きを読む

カテゴリー: cs.CV | コメントする

UFO: A Unified Approach to Fine-grained Visual Perception via Open-ended Language Interface

要約 ジェネラリストモデルは、言語とビジョンの両方のタスクで顕著な成功を収めてお … 続きを読む

カテゴリー: cs.CV | コメントする

A Joint Visual Compression and Perception Framework for Neuralmorphic Spiking Camera

要約 NeuralMorphic Spikeカメラの出現は、比類のない時間分解能 … 続きを読む

カテゴリー: cs.CV, eess.IV | コメントする

Creating Sorted Grid Layouts with Gradient-based Optimization

要約 視覚的にソートされたグリッドレイアウトは、空間的近接性を類似関係に合わせる … 続きを読む

カテゴリー: cs.CV | コメントする

UAR-NVC: A Unified AutoRegressive Framework for Memory-Efficient Neural Video Compression

要約 暗黙の神経表現(INR)は、ビデオをニューラルネットワークとして表現するこ … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする