cs.CV」カテゴリーアーカイブ

Reconstructing Hand-Held Objects in 3D from Images and Videos

要約 手で操作されるオブジェクト (マニピュランダ) は、インターネット ビデオ … 続きを読む

カテゴリー: cs.CV | Reconstructing Hand-Held Objects in 3D from Images and Videos はコメントを受け付けていません

Quark: Real-time, High-resolution, and General Neural View Synthesis

要約 我々は、高品質、高解像度、リアルタイムの新規ビュー合成を実行するための新し … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.LG | Quark: Real-time, High-resolution, and General Neural View Synthesis はコメントを受け付けていません

Factorized Visual Tokenization and Generation

要約 ビジュアルトークナイザーは画像生成の基礎です。 視覚データを個別のトークン … 続きを読む

カテゴリー: cs.CV | Factorized Visual Tokenization and Generation はコメントを受け付けていません

Generative Omnimatte: Learning to Decompose Video into Layers

要約 ビデオと一連の入力オブジェクト マスクが与えられると、オムニマット手法は、 … 続きを読む

カテゴリー: cs.CV | Generative Omnimatte: Learning to Decompose Video into Layers はコメントを受け付けていません

OminiControl: Minimal and Universal Control for Diffusion Transformer

要約 このペーパーでは、画像条件を事前トレーニング済みの拡散変換 (DiT) モ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | OminiControl: Minimal and Universal Control for Diffusion Transformer はコメントを受け付けていません

VisionPAD: A Vision-Centric Pre-training Paradigm for Autonomous Driving

要約 この論文では、自動運転におけるビジョン中心のアルゴリズム用に設計された新し … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | VisionPAD: A Vision-Centric Pre-training Paradigm for Autonomous Driving はコメントを受け付けていません

TopoSD: Topology-Enhanced Lane Segment Perception with SDMap Prior

要約 自動運転システムの最近の進歩は、アノテーションとメンテナンスに莫大なコスト … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | TopoSD: Topology-Enhanced Lane Segment Perception with SDMap Prior はコメントを受け付けていません

A Benchmark Dataset for Collaborative SLAM in Service Environments

要約 サービス環境の多様化に伴い、1台のロボットでは難しい複雑な作業が求められる … 続きを読む

カテゴリー: cs.CV, cs.RO | A Benchmark Dataset for Collaborative SLAM in Service Environments はコメントを受け付けていません

FastGrasp: Efficient Grasp Synthesis with Diffusion

要約 人間の手と物体の相互作用を効果的にモデル化することは、複雑な物理的制約とア … 続きを読む

カテゴリー: cs.CV, cs.RO | FastGrasp: Efficient Grasp Synthesis with Diffusion はコメントを受け付けていません

Unsupervised Multi-view UAV Image Geo-localization via Iterative Rendering

要約 無人航空機 (UAV) のクロスビュー地理位置特定 (CVGL) には、斜 … 続きを読む

カテゴリー: cs.CV, cs.RO, eess.IV | Unsupervised Multi-view UAV Image Geo-localization via Iterative Rendering はコメントを受け付けていません