cs.CV」カテゴリーアーカイブ

A Comprehensive Study on Medical Image Segmentation using Deep Neural Networks

要約 過去10年間で、ディープニューラルネットワーク(DNNS)を使用した医療画 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | A Comprehensive Study on Medical Image Segmentation using Deep Neural Networks はコメントを受け付けていません

Contour Errors: An Ego-Centric Metric for Reliable 3D Multi-Object Tracking

要約 自動運転車などの安全性の高いアプリケーションで、知覚システムの精度と信頼性 … 続きを読む

カテゴリー: cs.CV | Contour Errors: An Ego-Centric Metric for Reliable 3D Multi-Object Tracking はコメントを受け付けていません

Recent Advances in Medical Image Classification

要約 医療画像の分類は、診断と治療のために重要であり、人工知能の進歩から大きな恩 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | Recent Advances in Medical Image Classification はコメントを受け付けていません

MM-IQ: Benchmarking Human-Like Abstraction and Reasoning in Multimodal Models

要約 IQテストは、人間の認知能力を評価し、言語の背景、言語能力、またはドメイン … 続きを読む

カテゴリー: cs.AI, cs.CV | MM-IQ: Benchmarking Human-Like Abstraction and Reasoning in Multimodal Models はコメントを受け付けていません

UniCUE: Unified Recognition and Generation Framework for Chinese Cued Speech Video-to-Speech Generation

要約 手がかりのスピーチ(CS)は、ハンドコーディングを通じてリップリーディング … 続きを読む

カテゴリー: cs.CV, cs.SD, eess.AS | UniCUE: Unified Recognition and Generation Framework for Chinese Cued Speech Video-to-Speech Generation はコメントを受け付けていません

MMR-V: What’s Left Unsaid? A Benchmark for Multimodal Deep Reasoning in Videos

要約 ビデオのシーケンシャル構造は、マルチフレームの証拠を見つけてマルチモーダル … 続きを読む

カテゴリー: cs.CL, cs.CV | MMR-V: What’s Left Unsaid? A Benchmark for Multimodal Deep Reasoning in Videos はコメントを受け付けていません

Person Re-Identification System at Semantic Level based on Pedestrian Attributes Ontology

要約 人の再識別(REID)は、人々の追跡、公共の場所で人を見つけたり、スーパー … 続きを読む

カテゴリー: cs.AI, cs.CV | Person Re-Identification System at Semantic Level based on Pedestrian Attributes Ontology はコメントを受け付けていません

Rapid Bone Scintigraphy Enhancement via Semantic Prior Distillation from Segment Anything Model

要約 急速な骨シンチグラフィは、骨格障害の診断と子供の腫瘍転移を検出するために重 … 続きを読む

カテゴリー: cs.CV, eess.IV | Rapid Bone Scintigraphy Enhancement via Semantic Prior Distillation from Segment Anything Model はコメントを受け付けていません

EnergyMoGen: Compositional Human Motion Generation with Energy-Based Diffusion Model in Latent Space

要約 拡散モデル、特に潜在的な拡散モデルは、テキスト駆動型の人間の運動生成におい … 続きを読む

カテゴリー: cs.CV | EnergyMoGen: Compositional Human Motion Generation with Energy-Based Diffusion Model in Latent Space はコメントを受け付けていません

Generalized Diffusion Detector: Mining Robust Features from Diffusion Models for Domain-Generalized Detection

要約 オブジェクト検出のドメイン一般化(DG)は、目に見えないシナリオでの検出器 … 続きを読む

カテゴリー: cs.CV | Generalized Diffusion Detector: Mining Robust Features from Diffusion Models for Domain-Generalized Detection はコメントを受け付けていません