
LaMamba-Diff: Linear-Time High-Fidelity Diffusion Models Based on Local Attention and Mamba

要約 最近の Transformer ベースの拡散モデルは、顕著なパフォーマンス … 続きを読む

カテゴリー: cs.CV | LaMamba-Diff: Linear-Time High-Fidelity Diffusion Models Based on Local Attention and Mamba はコメントを受け付けていません

3DGS-Calib: 3D Gaussian Splatting for Multimodal SpatioTemporal Calibration

要約 信頼性の高いマルチモーダル センサー フュージョン アルゴリズムには、正確 … 続きを読む

カテゴリー: cs.CV, cs.RO | 3DGS-Calib: 3D Gaussian Splatting for Multimodal SpatioTemporal Calibration はコメントを受け付けていません

RaggeDi: Diffusion-based State Estimation of Disordered Rags, Sheets, Towels and Blankets

要約 布地の状態推定はロボット工学における重要な問題です。 布を操作し、ロボット … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | RaggeDi: Diffusion-based State Estimation of Disordered Rags, Sheets, Towels and Blankets はコメントを受け付けていません

Physically-Based Photometric Bundle Adjustment in Non-Lambertian Environments

要約 フォトメトリック バンドル調整 (PBA) は、ランバート世界を仮定してカ … 続きを読む

カテゴリー: cs.CV, cs.RO | Physically-Based Photometric Bundle Adjustment in Non-Lambertian Environments はコメントを受け付けていません

Finding the Subjective Truth: Collecting 2 Million Votes for Comprehensive Gen-AI Model Evaluation

要約 テキストから画像へのモデルのパフォーマンスを効率的に評価することは、本質的 … 続きを読む

カテゴリー: cs.AI, cs.CV | Finding the Subjective Truth: Collecting 2 Million Votes for Comprehensive Gen-AI Model Evaluation はコメントを受け付けていません

Agglomerative Token Clustering

要約 我々は、画像分類、画像合成、オブジェクト検出とセグメンテーションのタスクに … 続きを読む

カテゴリー: cs.CV | Agglomerative Token Clustering はコメントを受け付けていません

GDTS: Goal-Guided Diffusion Model with Tree Sampling for Multi-Modal Pedestrian Trajectory Prediction

要約 自動運転の安全性を向上させるには、歩行者の軌跡を正確に予測することが重要で … 続きを読む

カテゴリー: cs.CV | GDTS: Goal-Guided Diffusion Model with Tree Sampling for Multi-Modal Pedestrian Trajectory Prediction はコメントを受け付けていません

Differentiable Collision-Supervised Tooth Arrangement Network with a Decoupling Perspective

要約 歯の配置は、デジタル矯正計画プロセスにおいて重要なステップです。 既存の学 … 続きを読む

カテゴリー: cs.CV | Differentiable Collision-Supervised Tooth Arrangement Network with a Decoupling Perspective はコメントを受け付けていません

GaussianHeads: End-to-End Learning of Drivable Gaussian Head Avatars from Coarse-to-fine Representations

要約 人間の頭のアバターのリアルタイム レンダリングは、いくつか例を挙げると、拡 … 続きを読む

カテゴリー: cs.CV, cs.GR | GaussianHeads: End-to-End Learning of Drivable Gaussian Head Avatars from Coarse-to-fine Representations はコメントを受け付けていません

Tracking Any Point with Frame-Event Fusion Network at High Frame Rate

要約 画像フレームに基づく任意のポイントの追跡はフレーム レートによって制限され … 続きを読む

カテゴリー: cs.CV | Tracking Any Point with Frame-Event Fusion Network at High Frame Rate はコメントを受け付けていません