月別アーカイブ: 2024年5月

WorDepth: Variational Language Prior for Monocular Depth Estimation

要約 単一の画像からの 3 次元 (3D) 再構成は、スケールなどの固有の曖昧さ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | WorDepth: Variational Language Prior for Monocular Depth Estimation はコメントを受け付けていません

Trackastra: Transformer-based cell tracking for live-cell microscopy

要約 細胞追跡は、生細胞顕微鏡法において遍在する画像解析タスクです。 これは複数 … 続きを読む

カテゴリー: cs.CV | Trackastra: Transformer-based cell tracking for live-cell microscopy はコメントを受け付けていません

Hierarchical Uncertainty Exploration via Feedforward Posterior Trees

要約 不適切な逆設定の逆問題を解くとき、単一のもっともらしい再構成が提示されるよ … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV, stat.ML | Hierarchical Uncertainty Exploration via Feedforward Posterior Trees はコメントを受け付けていません

Disease-informed Adaptation of Vision-Language Models

要約 医療画像分析では、専門知識の不足とデータ注釈のコストが高いため、大規模な人 … 続きを読む

カテゴリー: cs.CV | Disease-informed Adaptation of Vision-Language Models はコメントを受け付けていません

Score identity Distillation: Exponentially Fast Distillation of Pretrained Diffusion Models for One-Step Generation

要約 スコア同一性蒸留 (SiD) を導入します。これは、事前トレーニングされた … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, stat.ML | Score identity Distillation: Exponentially Fast Distillation of Pretrained Diffusion Models for One-Step Generation はコメントを受け付けていません

LM4LV: A Frozen Large Language Model for Low-level Vision Tasks

要約 大規模言語モデル (LLM) の成功により、マルチモダリティ大規模言語モデ … 続きを読む

カテゴリー: cs.CV | LM4LV: A Frozen Large Language Model for Low-level Vision Tasks はコメントを受け付けていません

Multi-Track Timeline Control for Text-Driven 3D Human Motion Generation

要約 最近の生成モデリングの進歩により、短いプロンプトと指定された長さからキャラ … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.LG | Multi-Track Timeline Control for Text-Driven 3D Human Motion Generation はコメントを受け付けていません

ConvLLaVA: Hierarchical Backbones as Visual Encoder for Large Multimodal Models

要約 高解像度の大規模マルチモーダル モデル (LMM) は、過剰なビジュアル … 続きを読む

カテゴリー: cs.CV | ConvLLaVA: Hierarchical Backbones as Visual Encoder for Large Multimodal Models はコメントを受け付けていません

Hierarchical NeuroSymbolic Approach for Comprehensive and Explainable Action Quality Assessment

要約 アクション品質評価 (AQA) は、コンピューター ビジョンを応用して人間 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.SC | Hierarchical NeuroSymbolic Approach for Comprehensive and Explainable Action Quality Assessment はコメントを受け付けていません

ETTrack: Enhanced Temporal Motion Predictor for Multi-Object Tracking

要約 多くのマルチオブジェクト追跡 (MOT) アプローチは、モーション情報を利 … 続きを読む

カテゴリー: cs.CV | ETTrack: Enhanced Temporal Motion Predictor for Multi-Object Tracking はコメントを受け付けていません