月別アーカイブ: 2024年2月

Can you see me now? Blind spot estimation for autonomous vehicles using scenario-based simulation with random reference sensors

投稿日: 2024年2月15日作成者: jarxiv

要約この論文では、自動運転車やロボット工学アプリケーションのセンサー設定の死角 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Weatherproofing Retrieval for Localization with Generative AI and Geometric Consistency

投稿日: 2024年2月15日作成者: jarxiv

要約最先端の視覚的位置特定アプローチは一般に、最初の画像検索ステップに依存して … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Switch EMA: A Free Lunch for Better Flatness and Sharpness

投稿日: 2024年2月15日作成者: jarxiv

要約指数移動平均 (EMA) は、ディープニューラルネットワーク (DNN … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Efficient One-stage Video Object Detection by Exploiting Temporal Consistency

投稿日: 2024年2月15日作成者: jarxiv

要約最近、1 段階検出器は、画像データに対して従来の 2 段階検出器と比較して … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Synthesizing Knowledge-enhanced Features for Real-world Zero-shot Food Detection

投稿日: 2024年2月15日作成者: jarxiv

要約フードコンピューティングは、栄養と健康のためのビジョンベースの食品分析な … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

TDViT: Temporal Dilated Video Transformer for Dense Video Tasks

投稿日: 2024年2月15日作成者: jarxiv

要約 3D CNN やビデオトランスフォーマーなどのディープビデオモデルは … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Beyond still images: Temporal features and input variance resilience

投稿日: 2024年2月15日作成者: jarxiv

要約従来、視覚モデルは主に静止画像から抽出された空間特徴に依存しており、自然視 … 続きを読む →

カテゴリー: cs.AI, cs.CV, I.2.10 | コメントを受け付けていません

CM-MaskSD: Cross-Modality Masked Self-Distillation for Referring Image Segmentation

投稿日: 2024年2月15日作成者: jarxiv

要約参照画像セグメンテーション (RIS) は、与えられた自然言語表現に基づい … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Improving image quality of sparse-view lung tumor CT images with U-Net

投稿日: 2024年2月15日作成者: jarxiv

要約背景: 私たちは、肺転移検出に U-Net を使用してスパースビューのコン … 続きを読む →

カテゴリー: cs.CV, physics.med-ph | コメントを受け付けていません

MultiMedEval: A Benchmark and a Toolkit for Evaluating Medical Vision-Language Models

投稿日: 2024年2月15日作成者: jarxiv

要約大規模な医療視覚言語モデル (VLM) を公正かつ再現可能に評価するための … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2024年2月

Can you see me now? Blind spot estimation for autonomous vehicles using scenario-based simulation with random reference sensors

Weatherproofing Retrieval for Localization with Generative AI and Geometric Consistency

Switch EMA: A Free Lunch for Better Flatness and Sharpness

Efficient One-stage Video Object Detection by Exploiting Temporal Consistency

Synthesizing Knowledge-enhanced Features for Real-world Zero-shot Food Detection

TDViT: Temporal Dilated Video Transformer for Dense Video Tasks

Beyond still images: Temporal features and input variance resilience

CM-MaskSD: Cross-Modality Masked Self-Distillation for Referring Image Segmentation

Improving image quality of sparse-view lung tumor CT images with U-Net

MultiMedEval: A Benchmark and a Toolkit for Evaluating Medical Vision-Language Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー