-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年2月
Can you see me now? Blind spot estimation for autonomous vehicles using scenario-based simulation with random reference sensors
要約 この論文では、自動運転車やロボット工学アプリケーションのセンサー設定の死角 … 続きを読む
Weatherproofing Retrieval for Localization with Generative AI and Geometric Consistency
要約 最先端の視覚的位置特定アプローチは一般に、最初の画像検索ステップに依存して … 続きを読む
カテゴリー: cs.CV
Weatherproofing Retrieval for Localization with Generative AI and Geometric Consistency はコメントを受け付けていません
Switch EMA: A Free Lunch for Better Flatness and Sharpness
要約 指数移動平均 (EMA) は、ディープ ニューラル ネットワーク (DNN … 続きを読む
Efficient One-stage Video Object Detection by Exploiting Temporal Consistency
要約 最近、1 段階検出器は、画像データに対して従来の 2 段階検出器と比較して … 続きを読む
カテゴリー: cs.CV
Efficient One-stage Video Object Detection by Exploiting Temporal Consistency はコメントを受け付けていません
Synthesizing Knowledge-enhanced Features for Real-world Zero-shot Food Detection
要約 フード コンピューティングは、栄養と健康のためのビジョンベースの食品分析な … 続きを読む
カテゴリー: cs.CV
Synthesizing Knowledge-enhanced Features for Real-world Zero-shot Food Detection はコメントを受け付けていません
TDViT: Temporal Dilated Video Transformer for Dense Video Tasks
要約 3D CNN やビデオ トランスフォーマーなどのディープ ビデオ モデルは … 続きを読む
カテゴリー: cs.CV
TDViT: Temporal Dilated Video Transformer for Dense Video Tasks はコメントを受け付けていません
Beyond still images: Temporal features and input variance resilience
要約 従来、視覚モデルは主に静止画像から抽出された空間特徴に依存しており、自然視 … 続きを読む
CM-MaskSD: Cross-Modality Masked Self-Distillation for Referring Image Segmentation
要約 参照画像セグメンテーション (RIS) は、与えられた自然言語表現に基づい … 続きを読む
カテゴリー: cs.CV
CM-MaskSD: Cross-Modality Masked Self-Distillation for Referring Image Segmentation はコメントを受け付けていません
Improving image quality of sparse-view lung tumor CT images with U-Net
要約 背景: 私たちは、肺転移検出に U-Net を使用してスパースビューのコン … 続きを読む
カテゴリー: cs.CV, physics.med-ph
Improving image quality of sparse-view lung tumor CT images with U-Net はコメントを受け付けていません
MultiMedEval: A Benchmark and a Toolkit for Evaluating Medical Vision-Language Models
要約 大規模な医療視覚言語モデル (VLM) を公正かつ再現可能に評価するための … 続きを読む
カテゴリー: cs.CV
MultiMedEval: A Benchmark and a Toolkit for Evaluating Medical Vision-Language Models はコメントを受け付けていません