月別アーカイブ: 2024年2月

Can you see me now? Blind spot estimation for autonomous vehicles using scenario-based simulation with random reference sensors

要約 この論文では、自動運転車やロボット工学アプリケーションのセンサー設定の死角 … 続きを読む

カテゴリー: cs.CV, cs.RO | Can you see me now? Blind spot estimation for autonomous vehicles using scenario-based simulation with random reference sensors はコメントを受け付けていません

Weatherproofing Retrieval for Localization with Generative AI and Geometric Consistency

要約 最先端の視覚的位置特定アプローチは一般に、最初の画像検索ステップに依存して … 続きを読む

カテゴリー: cs.CV | Weatherproofing Retrieval for Localization with Generative AI and Geometric Consistency はコメントを受け付けていません

Switch EMA: A Free Lunch for Better Flatness and Sharpness

要約 指数移動平均 (EMA) は、ディープ ニューラル ネットワーク (DNN … 続きを読む

カテゴリー: cs.CV, cs.LG | Switch EMA: A Free Lunch for Better Flatness and Sharpness はコメントを受け付けていません

Efficient One-stage Video Object Detection by Exploiting Temporal Consistency

要約 最近、1 段階検出器は、画像データに対して従来の 2 段階検出器と比較して … 続きを読む

カテゴリー: cs.CV | Efficient One-stage Video Object Detection by Exploiting Temporal Consistency はコメントを受け付けていません

Synthesizing Knowledge-enhanced Features for Real-world Zero-shot Food Detection

要約 フード コンピューティングは、栄養と健康のためのビジョンベースの食品分析な … 続きを読む

カテゴリー: cs.CV | Synthesizing Knowledge-enhanced Features for Real-world Zero-shot Food Detection はコメントを受け付けていません

TDViT: Temporal Dilated Video Transformer for Dense Video Tasks

要約 3D CNN やビデオ トランスフォーマーなどのディープ ビデオ モデルは … 続きを読む

カテゴリー: cs.CV | TDViT: Temporal Dilated Video Transformer for Dense Video Tasks はコメントを受け付けていません

Beyond still images: Temporal features and input variance resilience

要約 従来、視覚モデルは主に静止画像から抽出された空間特徴に依存しており、自然視 … 続きを読む

カテゴリー: cs.AI, cs.CV, I.2.10 | Beyond still images: Temporal features and input variance resilience はコメントを受け付けていません

CM-MaskSD: Cross-Modality Masked Self-Distillation for Referring Image Segmentation

要約 参照画像セグメンテーション (RIS) は、与えられた自然言語表現に基づい … 続きを読む

カテゴリー: cs.CV | CM-MaskSD: Cross-Modality Masked Self-Distillation for Referring Image Segmentation はコメントを受け付けていません

Improving image quality of sparse-view lung tumor CT images with U-Net

要約 背景: 私たちは、肺転移検出に U-Net を使用してスパースビューのコン … 続きを読む

カテゴリー: cs.CV, physics.med-ph | Improving image quality of sparse-view lung tumor CT images with U-Net はコメントを受け付けていません

MultiMedEval: A Benchmark and a Toolkit for Evaluating Medical Vision-Language Models

要約 大規模な医療視覚言語モデル (VLM) を公正かつ再現可能に評価するための … 続きを読む

カテゴリー: cs.CV | MultiMedEval: A Benchmark and a Toolkit for Evaluating Medical Vision-Language Models はコメントを受け付けていません