cs.CV」カテゴリーアーカイブ

Towards the Characterization of Representations Learned via Capsule-based Network Architectures

要約 カプセル ネットワーク (CapsNets) は、標準のディープ ニューラ … 続きを読む

カテゴリー: cs.CV, cs.LG | Towards the Characterization of Representations Learned via Capsule-based Network Architectures はコメントを受け付けていません

ADA-Track++: End-to-End Multi-Camera 3D Multi-Object Tracking with Alternating Detection and Association

要約 3D マルチオブジェクト トラッキング (MOT) のクエリベースのアプロ … 続きを読む

カテゴリー: cs.CV | ADA-Track++: End-to-End Multi-Camera 3D Multi-Object Tracking with Alternating Detection and Association はコメントを受け付けていません

GAF: Gaussian Avatar Reconstruction from Monocular Videos via Multi-view Diffusion

要約 私たちは、スマートフォンなどの汎用デバイスでキャプチャされた単眼ビデオから … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | GAF: Gaussian Avatar Reconstruction from Monocular Videos via Multi-view Diffusion はコメントを受け付けていません

RAID-Database: human Responses to Affine Image Distortions

要約 画質データベースは、人間の主観的な知覚を予測するためのモデルをトレーニング … 続きを読む

カテゴリー: cs.CV, q-bio.NC, q-bio.QM | RAID-Database: human Responses to Affine Image Distortions はコメントを受け付けていません

Low-Latency Scalable Streaming for Event-Based Vision

要約 最近、高速、低消費電力のビデオ キャプチャ用の新しい「イベントベース」カメ … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.NI | Low-Latency Scalable Streaming for Event-Based Vision はコメントを受け付けていません

Learning Complex Non-Rigid Image Edits from Multimodal Conditioning

要約 この論文では、特定の人間 (具体的には、人物の 1 つの画像) を小説のシ … 続きを読む

カテゴリー: cs.CV | Learning Complex Non-Rigid Image Edits from Multimodal Conditioning はコメントを受け付けていません

CAS-GAN for Contrast-free Angiography Synthesis

要約 ヨード造影剤は数多くの介入処置で広く利用されていますが、患者に重大な健康リ … 続きを読む

カテゴリー: cs.CV, eess.IV | CAS-GAN for Contrast-free Angiography Synthesis はコメントを受け付けていません

SPT: Sequence Prompt Transformer for Interactive Image Segmentation

要約 インタラクティブなセグメンテーションは、ユーザーによるクリックに基づいて画 … 続きを読む

カテゴリー: cs.CV | SPT: Sequence Prompt Transformer for Interactive Image Segmentation はコメントを受け付けていません

SuperGSeg: Open-Vocabulary 3D Segmentation with Structured Super-Gaussians

要約 3D ガウス スプラッティングは、効率的なトレーニングとリアルタイム レン … 続きを読む

カテゴリー: cs.CV | SuperGSeg: Open-Vocabulary 3D Segmentation with Structured Super-Gaussians はコメントを受け付けていません

EnvPoser: Environment-aware Realistic Human Motion Estimation from Sparse Observations with Uncertainty Modeling

要約 VR デバイスからの頭と手の追跡信号を使用して全身の動きを推定することは、 … 続きを読む

カテゴリー: cs.CV | EnvPoser: Environment-aware Realistic Human Motion Estimation from Sparse Observations with Uncertainty Modeling はコメントを受け付けていません