月別アーカイブ: 2023年6月

Devil is in Channels: Contrastive Single Domain Generalization for Medical Image Segmentation

要約 深層学習ベースの医療画像セグメンテーション モデルは、新しい医療センターに … 続きを読む

カテゴリー: cs.CV | Devil is in Channels: Contrastive Single Domain Generalization for Medical Image Segmentation はコメントを受け付けていません

Unscented Autoencoder

要約 変分オートエンコーダー (VAE) は、潜在変数を使用した深い生成モデリン … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Unscented Autoencoder はコメントを受け付けていません

EXOT: Exit-aware Object Tracker for Safe Robotic Manipulation of Moving Object

要約 現在のロボットハンド操作は、限られた環境内で予測可能な位置にある物体を操作 … 続きを読む

カテゴリー: cs.CV | EXOT: Exit-aware Object Tracker for Safe Robotic Manipulation of Moving Object はコメントを受け付けていません

On the Hidden Mystery of OCR in Large Multimodal Models

要約 大規模モデルは、最近、自然言語処理とマルチモーダル視覚言語学習において主要 … 続きを読む

カテゴリー: cs.CL, cs.CV | On the Hidden Mystery of OCR in Large Multimodal Models はコメントを受け付けていません

Factorized Contrastive Learning: Going Beyond Multi-view Redundancy

要約 幅広いマルチモーダルタスクにおいて、対比学習は、ペア情報(画像とキャプショ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | Factorized Contrastive Learning: Going Beyond Multi-view Redundancy はコメントを受け付けていません

Image Clustering via the Principle of Rate Reduction in the Age of Pretrained Models

要約 大規模な事前トレーニング済みモデルの出現は、視覚表現の学習と自然言語処理の … 続きを読む

カテゴリー: cs.CV, cs.LG | Image Clustering via the Principle of Rate Reduction in the Age of Pretrained Models はコメントを受け付けていません

Out-of-domain GAN inversion via Invertibility Decomposition for Photo-Realistic Human Face Manipulation

要約 Generative Adversarial Networks (GAN) … 続きを読む

カテゴリー: cs.CV | Out-of-domain GAN inversion via Invertibility Decomposition for Photo-Realistic Human Face Manipulation はコメントを受け付けていません

Connectional-Style-Guided Contextual Representation Learning for Brain Disease Diagnosis

要約 構造磁気共鳴画像法 (sMRI) は大きな臨床的価値を示しており、深層学習 … 続きを読む

カテゴリー: cs.CV, eess.IV | Connectional-Style-Guided Contextual Representation Learning for Brain Disease Diagnosis はコメントを受け付けていません

One does not fit all! On the Complementarity of Vision Encoders for Vision and Language Tasks

要約 現在のマルチモーダル モデルは、ビジョンと言語 (V+L) タスクの解決を … 続きを読む

カテゴリー: cs.CL, cs.CV | One does not fit all! On the Complementarity of Vision Encoders for Vision and Language Tasks はコメントを受け付けていません

Enhance-NeRF: Multiple Performance Evaluation for Neural Radiance Fields

要約 3 次元再構築の品質は、仮想現実 (VR) や拡張現実 (AR) テクノロ … 続きを読む

カテゴリー: cs.CV | Enhance-NeRF: Multiple Performance Evaluation for Neural Radiance Fields はコメントを受け付けていません