cs.AI」カテゴリーアーカイブ

FedSaaS: Class-Consistency Federated Semantic Segmentation via Global Prototype Supervision and Local Adversarial Harmonization

要約 フェデレーションセマンティックセグメンテーションにより、データプライバシー … 続きを読む

カテゴリー: cs.AI, cs.CV | FedSaaS: Class-Consistency Federated Semantic Segmentation via Global Prototype Supervision and Local Adversarial Harmonization はコメントを受け付けていません

Efficient approximation of Earth Mover’s Distance Based on Nearest Neighbor Search

要約 Earth Moverの距離(EMD)は、コンピュータービジョンと他の多く … 続きを読む

カテゴリー: cs.AI, cs.CV | Efficient approximation of Earth Mover’s Distance Based on Nearest Neighbor Search はコメントを受け付けていません

UMotion: Uncertainty-driven Human Motion Estimation from Inertial and Ultra-wideband Units

要約 スパースウェアラブル慣性測定ユニット(IMUS)は、3Dヒトの動きを推定す … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | UMotion: Uncertainty-driven Human Motion Estimation from Inertial and Ultra-wideband Units はコメントを受け付けていません

Endo-CLIP: Progressive Self-Supervised Pre-training on Raw Colonoscopy Records

要約 画像テキストの大腸内視鏡検査記録の事前トレーニングは、内視鏡画像分析を改善 … 続きを読む

カテゴリー: cs.AI, cs.CV | Endo-CLIP: Progressive Self-Supervised Pre-training on Raw Colonoscopy Records はコメントを受け付けていません

A 2D Semantic-Aware Position Encoding for Vision Transformers

要約 ビジョン変圧器は、自己関節を通じて長距離の依存関係と文脈的関係をキャプチャ … 続きを読む

カテゴリー: cs.AI, cs.CV | A 2D Semantic-Aware Position Encoding for Vision Transformers はコメントを受け付けていません

Flash-VL 2B: Optimizing Vision-Language Model Performance for Ultra-Low Latency and High Throughput

要約 このホワイトペーパーでは、リアルタイムアプリケーション向けに視覚言語モデル … 続きを読む

カテゴリー: cs.AI, cs.CV | Flash-VL 2B: Optimizing Vision-Language Model Performance for Ultra-Low Latency and High Throughput はコメントを受け付けていません

State-of-the-Art Periorbital Distance Prediction and Disease Classification Using Periorbital Features

要約 眼窩周囲距離は、さまざまな眼形成および頭蓋顔面の状態を診断および監視するた … 続きを読む

カテゴリー: cs.AI, cs.CV | State-of-the-Art Periorbital Distance Prediction and Disease Classification Using Periorbital Features はコメントを受け付けていません

Meta-learning Slice-to-Volume Reconstruction in Fetal Brain MRI using Implicit Neural Representations

要約 複数の動き腐敗した低解像度2Dスライスからの高解像度スライスから容積再構成 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | Meta-learning Slice-to-Volume Reconstruction in Fetal Brain MRI using Implicit Neural Representations はコメントを受け付けていません

BLIP3-o: A Family of Fully Open Unified Multimodal Models-Architecture, Training and Dataset

要約 統一された画像の理解と生成は、マルチモーダルモデルに関する最近の研究で注目 … 続きを読む

カテゴリー: cs.AI, cs.CV | BLIP3-o: A Family of Fully Open Unified Multimodal Models-Architecture, Training and Dataset はコメントを受け付けていません

Variational Visual Question Answering

要約 視覚的な質問応答(VQA)のマルチモーダルモデルでは顕著な進歩にもかかわら … 続きを読む

カテゴリー: cs.AI, cs.CV | Variational Visual Question Answering はコメントを受け付けていません