「cs.CV」カテゴリーアーカイブ

Towards the Characterization of Representations Learned via Capsule-based Network Architectures

投稿日: 2024年12月16日作成者: jarxiv

要約カプセルネットワーク (CapsNets) は、標準のディープニューラ … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

ADA-Track++: End-to-End Multi-Camera 3D Multi-Object Tracking with Alternating Detection and Association

投稿日: 2024年12月16日作成者: jarxiv

要約 3D マルチオブジェクトトラッキング (MOT) のクエリベースのアプロ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

GAF: Gaussian Avatar Reconstruction from Monocular Videos via Multi-view Diffusion

投稿日: 2024年12月16日作成者: jarxiv

要約私たちは、スマートフォンなどの汎用デバイスでキャプチャされた単眼ビデオから … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.GR | コメントを受け付けていません

RAID-Database: human Responses to Affine Image Distortions

投稿日: 2024年12月16日作成者: jarxiv

要約画質データベースは、人間の主観的な知覚を予測するためのモデルをトレーニング … 続きを読む →

カテゴリー: cs.CV, q-bio.NC, q-bio.QM | コメントを受け付けていません

Low-Latency Scalable Streaming for Event-Based Vision

投稿日: 2024年12月16日作成者: jarxiv

要約最近、高速、低消費電力のビデオキャプチャ用の新しい「イベントベース」カメ … 続きを読む →

カテゴリー: cs.CV, cs.MM, cs.NI | コメントを受け付けていません

Learning Complex Non-Rigid Image Edits from Multimodal Conditioning

投稿日: 2024年12月16日作成者: jarxiv

要約この論文では、特定の人間 (具体的には、人物の 1 つの画像) を小説のシ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

CAS-GAN for Contrast-free Angiography Synthesis

投稿日: 2024年12月16日作成者: jarxiv

要約ヨード造影剤は数多くの介入処置で広く利用されていますが、患者に重大な健康リ … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

SPT: Sequence Prompt Transformer for Interactive Image Segmentation

投稿日: 2024年12月16日作成者: jarxiv

要約インタラクティブなセグメンテーションは、ユーザーによるクリックに基づいて画 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

SuperGSeg: Open-Vocabulary 3D Segmentation with Structured Super-Gaussians

投稿日: 2024年12月16日作成者: jarxiv

要約 3D ガウススプラッティングは、効率的なトレーニングとリアルタイムレン … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

EnvPoser: Environment-aware Realistic Human Motion Estimation from Sparse Observations with Uncertainty Modeling

投稿日: 2024年12月16日作成者: jarxiv

要約 VR デバイスからの頭と手の追跡信号を使用して全身の動きを推定することは、 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Towards the Characterization of Representations Learned via Capsule-based Network Architectures

ADA-Track++: End-to-End Multi-Camera 3D Multi-Object Tracking with Alternating Detection and Association

GAF: Gaussian Avatar Reconstruction from Monocular Videos via Multi-view Diffusion

RAID-Database: human Responses to Affine Image Distortions

Low-Latency Scalable Streaming for Event-Based Vision

Learning Complex Non-Rigid Image Edits from Multimodal Conditioning

CAS-GAN for Contrast-free Angiography Synthesis

SPT: Sequence Prompt Transformer for Interactive Image Segmentation

SuperGSeg: Open-Vocabulary 3D Segmentation with Structured Super-Gaussians

EnvPoser: Environment-aware Realistic Human Motion Estimation from Sparse Observations with Uncertainty Modeling

最近の投稿

最近のコメント

アーカイブ

カテゴリー