cs.CV」カテゴリーアーカイブ

VascX Models: Model Ensembles for Retinal Vascular Analysis from Color Fundus Images

要約 カラー眼底画像(CFI)から網膜血管系を解析するための包括的なモデル群であ … 続きを読む

カテゴリー: cs.CV, eess.IV, q-bio.TO | VascX Models: Model Ensembles for Retinal Vascular Analysis from Color Fundus Images はコメントを受け付けていません

GeoSplatting: Towards Geometry Guided Gaussian Splatting for Physically-based Inverse Rendering

要約 我々は、3Dガウス・スプラッティング(3DGS)表現を用いた物理ベースの逆 … 続きを読む

カテゴリー: cs.CV | GeoSplatting: Towards Geometry Guided Gaussian Splatting for Physically-based Inverse Rendering はコメントを受け付けていません

DELTA: Dense Efficient Long-range 3D Tracking for any video

要約 単眼動画から高密度の3Dモーションを追跡することは、特に長時間のシーケンス … 続きを読む

カテゴリー: cs.CV | DELTA: Dense Efficient Long-range 3D Tracking for any video はコメントを受け付けていません

DistillNeRF: Perceiving 3D Scenes from Single-Glance Images by Distilling Neural Fields and Foundation Model Features

要約 私たちは、屋外の自動運転シーンにおける限られた 2D 観察から 3D 環境 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | DistillNeRF: Perceiving 3D Scenes from Single-Glance Images by Distilling Neural Fields and Foundation Model Features はコメントを受け付けていません

XRDSLAM: A Flexible and Modular Framework for Deep Learning based SLAM

要約 この論文では、柔軟な SLAM フレームワークである XRDSLAM を提 … 続きを読む

カテゴリー: cs.CV, cs.RO | XRDSLAM: A Flexible and Modular Framework for Deep Learning based SLAM はコメントを受け付けていません

FM-Fusion: Instance-aware Semantic Mapping Boosted by Vision-Language Foundation Models

要約 監視対象オブジェクト検出器に基づくセマンティック マッピングは、画像分布の … 続きを読む

カテゴリー: cs.CV, cs.RO | FM-Fusion: Instance-aware Semantic Mapping Boosted by Vision-Language Foundation Models はコメントを受け付けていません

iVideoGPT: Interactive VideoGPTs are Scalable World Models

要約 ワールド モデルにより、モデルベースのエージェントは、現実世界の意思決定の … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | iVideoGPT: Interactive VideoGPTs are Scalable World Models はコメントを受け付けていません

GIC: Gaussian-Informed Continuum for Physical Property Identification and Simulation

要約 この論文では、視覚的観察による物理的特性の推定 (システム同定) の問題を … 続きを読む

カテゴリー: cs.CV, cs.RO | GIC: Gaussian-Informed Continuum for Physical Property Identification and Simulation はコメントを受け付けていません

SuperFusion: Multilevel LiDAR-Camera Fusion for Long-Range HD Map Generation

要約 環境の高解像度 (HD) セマンティック マップの生成は、自動運転の重要な … 続きを読む

カテゴリー: cs.CV, cs.RO | SuperFusion: Multilevel LiDAR-Camera Fusion for Long-Range HD Map Generation はコメントを受け付けていません

BitStack: Fine-Grained Size Control for Compressed Large Language Models in Variable Memory Environments

要約 大規模言語モデル (LLM) は多くのアプリケーションに革命をもたらしまし … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | BitStack: Fine-Grained Size Control for Compressed Large Language Models in Variable Memory Environments はコメントを受け付けていません