「cs.CV」カテゴリーアーカイブ

H-Net: A Multitask Architecture for Simultaneous 3D Force Estimation and Stereo Semantic Segmentation in Intracardiac Catheters

投稿日: 2025年1月5日作成者: jarxiv

要約カテーテル治療の成功率は、外科医に提供される感覚データと密接な関係がある。 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO, eess.IV | コメントを受け付けていません

Sidewalk Hazard Detection Using Variational Autoencoder and One-Class SVM

投稿日: 2025年1月5日作成者: jarxiv

要約予測不可能な屋外環境は、多くの安全上の懸念をもたらし、安全なナビゲーション … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.RO | コメントを受け付けていません

MSC-Bench: Benchmarking and Analyzing Multi-Sensor Corruption for Driving Perception

投稿日: 2025年1月5日作成者: jarxiv

要約マルチセンサーフュージョンモデルは、自律走行知覚、特に3D物体検出やHDマ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

Leverage Cross-Attention for End-to-End Open-Vocabulary Panoptic Reconstruction

投稿日: 2025年1月5日作成者: jarxiv

要約オープンボキャブラリーパノプティック再構成は、包括的なシーン理解を提供し、 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Exploiting Latent Properties to Optimize Neural Codecs

投稿日: 2025年1月5日作成者: jarxiv

要約エンドツーエンドの画像およびビデオコーデックは、何十年にもわたる手作業によ … 続きを読む →

カテゴリー: 68T07, cs.CV, cs.LG, I.4.2 | コメントを受け付けていません

SVFR: A Unified Framework for Generalized Video Face Restoration

投稿日: 2025年1月5日作成者: jarxiv

要約顔復元（Face Restoration：FR）は、劣化した入力から高品質 … 続きを読む →

カテゴリー: cs.CV, cs.LG, eess.IV | コメントを受け付けていません

EHCTNet: Enhanced Hybrid of CNN and Transformer Network for Remote Sensing Image Change Detection

投稿日: 2025年1月5日作成者: jarxiv

要約リモートセンシング(RS)による変化検出は、偽陽性よりも偽陰性の方がコスト … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Asymmetric Reinforcing against Multi-modal Representation Bias

投稿日: 2025年1月5日作成者: jarxiv

要約マルチモーダル学習の強みは、様々な情報源からの情報を統合し、豊かで包括的な … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Face-Human-Bench: A Comprehensive Benchmark of Face and Human Understanding for Multi-modal Assistants

投稿日: 2025年1月5日作成者: jarxiv

要約顔と人間は、社会的相互作用における重要な要素であり、日常の写真やビデオに広 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

SeFAR: Semi-supervised Fine-grained Action Recognition with Temporal Perturbation and Learning Stabilization

投稿日: 2025年1月5日作成者: jarxiv

要約人間の行動理解は、マルチモーダルシステムの進歩にとって極めて重要である。強 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

H-Net: A Multitask Architecture for Simultaneous 3D Force Estimation and Stereo Semantic Segmentation in Intracardiac Catheters

Sidewalk Hazard Detection Using Variational Autoencoder and One-Class SVM

MSC-Bench: Benchmarking and Analyzing Multi-Sensor Corruption for Driving Perception

Leverage Cross-Attention for End-to-End Open-Vocabulary Panoptic Reconstruction

Exploiting Latent Properties to Optimize Neural Codecs

SVFR: A Unified Framework for Generalized Video Face Restoration

EHCTNet: Enhanced Hybrid of CNN and Transformer Network for Remote Sensing Image Change Detection

Asymmetric Reinforcing against Multi-modal Representation Bias

Face-Human-Bench: A Comprehensive Benchmark of Face and Human Understanding for Multi-modal Assistants

SeFAR: Semi-supervised Fine-grained Action Recognition with Temporal Perturbation and Learning Stabilization

最近の投稿

最近のコメント

アーカイブ

カテゴリー