月別アーカイブ: 2024年3月

A Variational Approach for Joint Image Recovery and Feature Extraction Based on Spatially-Varying Generalised Gaussian Models

要約 再構成と特徴抽出の同時問題は、画像処理における困難なタスクです。 これは、 … 続きを読む

カテゴリー: cs.CV, cs.NA, math.NA | A Variational Approach for Joint Image Recovery and Feature Extraction Based on Spatially-Varying Generalised Gaussian Models はコメントを受け付けていません

Attention Guidance Mechanism for Handwritten Mathematical Expression Recognition

要約 手書き数式認識 (HMER) は、数式のレイアウトが複雑であるため、画像か … 続きを読む

カテゴリー: cs.CV | Attention Guidance Mechanism for Handwritten Mathematical Expression Recognition はコメントを受け付けていません

Language-EXtended Indoor SLAM (LEXIS): A Versatile System for Real-time Visual Scene Understanding

要約 多用途かつ適応的な意味理解により、自律システムが周囲の環境を理解し、相互作 … 続きを読む

カテゴリー: cs.CV, cs.RO, eess.IV | Language-EXtended Indoor SLAM (LEXIS): A Versatile System for Real-time Visual Scene Understanding はコメントを受け付けていません

A Backpack Full of Skills: Egocentric Video Understanding with Diverse Task Perspectives

要約 ビデオ ストリームに対する人間の理解力は当然幅広く、瞬時に何が起こっている … 続きを読む

カテゴリー: cs.CV, cs.LG | A Backpack Full of Skills: Egocentric Video Understanding with Diverse Task Perspectives はコメントを受け付けていません

CrackNex: a Few-shot Low-light Crack Segmentation Model Based on Retinex Theory for UAV Inspections

要約 コンクリート構造物の定期的な目視検査は、重要なインフラの安全性と完全性を維 … 続きを読む

カテゴリー: cs.CV | CrackNex: a Few-shot Low-light Crack Segmentation Model Based on Retinex Theory for UAV Inspections はコメントを受け付けていません

MiKASA: Multi-Key-Anchor & Scene-Aware Transformer for 3D Visual Grounding

要約 3D 視覚的グラウンディングには、自然言語の説明と 3D 空間内の対応する … 続きを読む

カテゴリー: cs.CV | MiKASA: Multi-Key-Anchor & Scene-Aware Transformer for 3D Visual Grounding はコメントを受け付けていません

Recall-Oriented Continual Learning with Generative Adversarial Meta-Model

要約 安定性と可塑性のジレンマは、新しいタスクを学習しながら以前のタスクのパフォ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Recall-Oriented Continual Learning with Generative Adversarial Meta-Model はコメントを受け付けていません

Cross Pseudo-Labeling for Semi-Supervised Audio-Visual Source Localization

要約 AVSL (Audio-Visual Source Localizatio … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | Cross Pseudo-Labeling for Semi-Supervised Audio-Visual Source Localization はコメントを受け付けていません

Improved LiDAR Odometry and Mapping using Deep Semantic Segmentation and Novel Outliers Detection

要約 知覚は、インテリジェントな自律ナビゲーションを実現するための重要な要素です … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Improved LiDAR Odometry and Mapping using Deep Semantic Segmentation and Novel Outliers Detection はコメントを受け付けていません

Motion-Corrected Moving Average: Including Post-Hoc Temporal Information for Improved Video Segmentation

要約 コンピュータ支援介入には、リアルタイムの計算速度と高度な精度が必要です。 … 続きを読む

カテゴリー: cs.CV | Motion-Corrected Moving Average: Including Post-Hoc Temporal Information for Improved Video Segmentation はコメントを受け付けていません