-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年7月
Novel Hybrid Integrated Pix2Pix and WGAN Model with Gradient Penalty for Binary Images Denoising
要約 このペーパーでは、敵対的生成ネットワーク (GAN) の利点を活用した画像 … 続きを読む
SphereHead: Stable 3D Full-head Synthesis with Spherical Tri-plane Representation
要約 3D 対応の敵対的生成ネットワーク (GAN) の最近の進歩は、ほぼ正面か … 続きを読む
カテゴリー: cs.CV
SphereHead: Stable 3D Full-head Synthesis with Spherical Tri-plane Representation はコメントを受け付けていません
A Simple Latent Diffusion Approach for Panoptic Segmentation and Mask Inpainting
要約 パノプティック ネットワークとインスタンス セグメンテーション ネットワー … 続きを読む
Towards Reliable Evaluation and Fast Training of Robust Semantic Segmentation Models
要約 敵対的堅牢性は、画像分類、特に $\ell_\infty$ 脅威モデルに関 … 続きを読む
GVGEN: Text-to-3D Generation with Volumetric Representation
要約 近年、3D ガウス スプラッティングは 3D 再構成および生成のための強力 … 続きを読む
カテゴリー: cs.CV
GVGEN: Text-to-3D Generation with Volumetric Representation はコメントを受け付けていません
3D-COCO: extension of MS-COCO dataset for image detection and 3D reconstruction modules
要約 3D モデルと 2D-3D アライメント アノテーションを提供するオリジナ … 続きを読む
カテゴリー: cs.CV
3D-COCO: extension of MS-COCO dataset for image detection and 3D reconstruction modules はコメントを受け付けていません
DepGAN: Leveraging Depth Maps for Handling Occlusions and Transparency in Image Composition
要約 画像の合成は、遠近感、照明、影、オクルージョン、オブジェクトの相互作用など … 続きを読む
カテゴリー: cs.CV
DepGAN: Leveraging Depth Maps for Handling Occlusions and Transparency in Image Composition はコメントを受け付けていません
OmniBind: Large-scale Omni Multimodal Representation via Binding Spaces
要約 最近、GPT-4o や Gemini など、さまざまなモダリティを使用した … 続きを読む
カテゴリー: cs.CV
OmniBind: Large-scale Omni Multimodal Representation via Binding Spaces はコメントを受け付けていません
Encapsulating Knowledge in One Prompt
要約 このパラダイムは、元のモデルを変更したり、トレーニング データへのアクセス … 続きを読む
カテゴリー: cs.CV
Encapsulating Knowledge in One Prompt はコメントを受け付けていません
SegSTRONG-C: Segmenting Surgical Tools Robustly On Non-adversarial Generated Corruptions — An EndoVis’24 Challenge
要約 ロボット支援手術におけるツールの正確なセグメンテーションは、拡張現実フィー … 続きを読む