cs.CV」カテゴリーアーカイブ

Vision language models have difficulty recognizing virtual objects

要約 Vision Language Models(VLMS)は、Multimo … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

SEAL: Searching Expandable Architectures for Incremental Learning

要約 インクリメンタル学習は、モデルがタスクの連続ストリームから学習する機械学習 … 続きを読む

カテゴリー: 68T07, cs.AI, cs.CV, cs.LG | コメントする

HWA-UNETR: Hierarchical Window Aggregate UNETR for 3D Multimodal Gastric Lesion Segmentation

要約 マルチモーダルの医療画像セグメンテーションは、胃がん病変分析の文脈において … 続きを読む

カテゴリー: cs.CV, eess.IV | コメントする

Consistent Quantity-Quality Control across Scenes for Deployment-Aware Gaussian Splatting

要約 ストレージと計算コストを削減するために、3D Gaussian Splut … 続きを読む

カテゴリー: cs.CV | コメントする

S2-Track: A Simple yet Strong Approach for End-to-End 3D Multi-Object Tracking

要約 3D複数オブジェクト追跡(MOT)は、自律的な駆動知覚において重要な役割を … 続きを読む

カテゴリー: cs.CV | コメントする

Logos as a Well-Tempered Pre-train for Sign Language Recognition

要約 このペーパーでは、孤立した手話認識(ISLR)タスクの2つの側面を検証しま … 続きを読む

カテゴリー: cs.CV | コメントする

UniEval: Unified Holistic Evaluation for Unified Multimodal Understanding and Generation

要約 統一されたマルチモーダルの理解と生成モデルの出現は、モデルの冗長性を最小限 … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

Multi-contrast laser endoscopy for in vivo gastrointestinal imaging

要約 白色光内視鏡検査は、胃腸管の疾患を検出するための臨床ゴールドスタンダードで … 続きを読む

カテゴリー: cs.CV, eess.IV, physics.optics | コメントする

CheXGenBench: A Unified Benchmark For Fidelity, Privacy and Utility of Synthetic Chest Radiographs

要約 Chexgenbenchを紹介します。これは、最先端のテキストから画像への … 続きを読む

カテゴリー: cs.CV | コメントする

MorphGuard: Morph Specific Margin Loss for Enhancing Robustness to Face Morphing Attacks

要約 顔認識は、深い学習技術の進歩とともに大幅に進化し、安全な認証を必要とするさ … 続きを読む

カテゴリー: cs.CV | コメントする