cs.CV」カテゴリーアーカイブ

A Unified Graph-based Framework for Scalable 3D Tree Reconstruction and Non-Destructive Biomass Estimation from Point Clouds

要約 地上森林のバイオマス(AGB)の推定は、炭素貯蔵を評価し、持続可能な森林管 … 続きを読む

カテゴリー: cs.CV | A Unified Graph-based Framework for Scalable 3D Tree Reconstruction and Non-Destructive Biomass Estimation from Point Clouds はコメントを受け付けていません

TARDIS STRIDE: A Spatio-Temporal Road Image Dataset and World Model for Autonomy

要約 世界モデルは、環境をシミュレートし、効果的なエージェントの動作を可能にする … 続きを読む

カテゴリー: cs.AI, cs.CV | TARDIS STRIDE: A Spatio-Temporal Road Image Dataset and World Model for Autonomy はコメントを受け付けていません

RDD: Robust Feature Detector and Descriptor using Deformable Transformer

要約 構造からのストレートとスラムの中心的なステップとして、大幅な視点の変化など … 続きを読む

カテゴリー: cs.CV | RDD: Robust Feature Detector and Descriptor using Deformable Transformer はコメントを受け付けていません

One-Step Diffusion for Detail-Rich and Temporally Consistent Video Super-Resolution

要約 特に、現実的な詳細合成のために安定した拡散(SD)などの事前に訓練された生 … 続きを読む

カテゴリー: cs.AI, cs.CV | One-Step Diffusion for Detail-Rich and Temporally Consistent Video Super-Resolution はコメントを受け付けていません

Mono-Modalizing Extremely Heterogeneous Multi-Modal Medical Image Registration

要約 臨床診療では、陽電子放出断層撮影(PET)や分数異方性(FA)などの機能的 … 続きを読む

カテゴリー: cs.CV, I.4.5 | Mono-Modalizing Extremely Heterogeneous Multi-Modal Medical Image Registration はコメントを受け付けていません

VideoHallu: Evaluating and Mitigating Multi-modal Hallucinations on Synthetic Video Understanding

要約 合成ビデオ生成は、そのリアリズムと幅広いアプリケーションに対して大きな注目 … 続きを読む

カテゴリー: cs.CV, cs.LG | VideoHallu: Evaluating and Mitigating Multi-modal Hallucinations on Synthetic Video Understanding はコメントを受け付けていません

A dataset of high-resolution plantar pressures for gait analysis across varying footwear and walking speeds

要約 歩行とは、歩行中に生成される四肢の動きのパターンを指します。これは、物理的 … 続きを読む

カテゴリー: cs.CV, cs.LG | A dataset of high-resolution plantar pressures for gait analysis across varying footwear and walking speeds はコメントを受け付けていません

I2I-Mamba: Multi-modal medical image synthesis via selective state space modeling

要約 マルチモーダルの医療画像合成には、ソースとターゲットモダリティの間の組織シ … 続きを読む

カテゴリー: cs.CV, eess.IV | I2I-Mamba: Multi-modal medical image synthesis via selective state space modeling はコメントを受け付けていません

Vision Transformers Don’t Need Trained Registers

要約 視覚変圧器における以前に特定された現象の根底にあるメカニズムを調査します。 … 続きを読む

カテゴリー: cs.AI, cs.CV | Vision Transformers Don’t Need Trained Registers はコメントを受け付けていません

BoxFusion: Reconstruction-Free Open-Vocabulary 3D Object Detection via Real-Time Multi-View Box Fusion

要約 自律的な運転と具体化されたAIにおける重要なアプリケーションにより、オープ … 続きを読む

カテゴリー: cs.CV | BoxFusion: Reconstruction-Free Open-Vocabulary 3D Object Detection via Real-Time Multi-View Box Fusion はコメントを受け付けていません