cs.CV」カテゴリーアーカイブ

H-Net: A Multitask Architecture for Simultaneous 3D Force Estimation and Stereo Semantic Segmentation in Intracardiac Catheters

要約 カテーテル治療の成功率は、外科医に提供される感覚データと密接な関係がある。 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO, eess.IV | H-Net: A Multitask Architecture for Simultaneous 3D Force Estimation and Stereo Semantic Segmentation in Intracardiac Catheters はコメントを受け付けていません

Sidewalk Hazard Detection Using Variational Autoencoder and One-Class SVM

要約 予測不可能な屋外環境は、多くの安全上の懸念をもたらし、安全なナビゲーション … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Sidewalk Hazard Detection Using Variational Autoencoder and One-Class SVM はコメントを受け付けていません

MSC-Bench: Benchmarking and Analyzing Multi-Sensor Corruption for Driving Perception

要約 マルチセンサーフュージョンモデルは、自律走行知覚、特に3D物体検出やHDマ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | MSC-Bench: Benchmarking and Analyzing Multi-Sensor Corruption for Driving Perception はコメントを受け付けていません

Leverage Cross-Attention for End-to-End Open-Vocabulary Panoptic Reconstruction

要約 オープンボキャブラリーパノプティック再構成は、包括的なシーン理解を提供し、 … 続きを読む

カテゴリー: cs.CV, cs.RO | Leverage Cross-Attention for End-to-End Open-Vocabulary Panoptic Reconstruction はコメントを受け付けていません

Exploiting Latent Properties to Optimize Neural Codecs

要約 エンドツーエンドの画像およびビデオコーデックは、何十年にもわたる手作業によ … 続きを読む

カテゴリー: 68T07, cs.CV, cs.LG, I.4.2 | Exploiting Latent Properties to Optimize Neural Codecs はコメントを受け付けていません

SVFR: A Unified Framework for Generalized Video Face Restoration

要約 顔復元(Face Restoration:FR)は、劣化した入力から高品質 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | SVFR: A Unified Framework for Generalized Video Face Restoration はコメントを受け付けていません

EHCTNet: Enhanced Hybrid of CNN and Transformer Network for Remote Sensing Image Change Detection

要約 リモートセンシング(RS)による変化検出は、偽陽性よりも偽陰性の方がコスト … 続きを読む

カテゴリー: cs.CV, cs.LG | EHCTNet: Enhanced Hybrid of CNN and Transformer Network for Remote Sensing Image Change Detection はコメントを受け付けていません

Asymmetric Reinforcing against Multi-modal Representation Bias

要約 マルチモーダル学習の強みは、様々な情報源からの情報を統合し、豊かで包括的な … 続きを読む

カテゴリー: cs.CV | Asymmetric Reinforcing against Multi-modal Representation Bias はコメントを受け付けていません

Face-Human-Bench: A Comprehensive Benchmark of Face and Human Understanding for Multi-modal Assistants

要約 顔と人間は、社会的相互作用における重要な要素であり、日常の写真やビデオに広 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Face-Human-Bench: A Comprehensive Benchmark of Face and Human Understanding for Multi-modal Assistants はコメントを受け付けていません

SeFAR: Semi-supervised Fine-grained Action Recognition with Temporal Perturbation and Learning Stabilization

要約 人間の行動理解は、マルチモーダルシステムの進歩にとって極めて重要である。強 … 続きを読む

カテゴリー: cs.CV, cs.LG | SeFAR: Semi-supervised Fine-grained Action Recognition with Temporal Perturbation and Learning Stabilization はコメントを受け付けていません