月別アーカイブ: 2024年3月

SkillDiffuser: Interpretable Hierarchical Planning via Skill Abstractions in Diffusion-Based Task Execution

要約 普及モデルは、ロボットの軌道計画に大きな可能性を秘めていることが実証されて … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | SkillDiffuser: Interpretable Hierarchical Planning via Skill Abstractions in Diffusion-Based Task Execution はコメントを受け付けていません

MANUS: Markerless Grasp Capture using Articulated 3D Gaussians

要約 私たちが手で物体をつかむ方法を理解することは、ロボット工学や複合現実などの … 続きを読む

カテゴリー: cs.CV | MANUS: Markerless Grasp Capture using Articulated 3D Gaussians はコメントを受け付けていません

Parameter Efficient Fine-tuning via Cross Block Orchestration for Segment Anything Model

要約 パラメーター効率の良い微調整 (PEFT) は、トレーニング データが限ら … 続きを読む

カテゴリー: cs.CV | Parameter Efficient Fine-tuning via Cross Block Orchestration for Segment Anything Model はコメントを受け付けていません

Towards Generalizable Tumor Synthesis

要約 腫瘍合成により、医療画像内に人工腫瘍を作成できるようになり、腫瘍の検出とセ … 続きを読む

カテゴリー: cs.CV, eess.IV | Towards Generalizable Tumor Synthesis はコメントを受け付けていません

The Bad Batches: Enhancing Self-Supervised Learning in Image Classification Through Representative Batch Curation

要約 人間の監督なしで堅牢な表現を学習することの追求は、長年の課題です。 自己教 … 続きを読む

カテゴリー: cs.CV | The Bad Batches: Enhancing Self-Supervised Learning in Image Classification Through Representative Batch Curation はコメントを受け付けていません

OV-Uni3DETR: Towards Unified Open-Vocabulary 3D Object Detection via Cycle-Modality Propagation

要約 3D オブジェクト検出研究の現状では、注釈付き 3D データの深刻な不足、 … 続きを読む

カテゴリー: cs.CV | OV-Uni3DETR: Towards Unified Open-Vocabulary 3D Object Detection via Cycle-Modality Propagation はコメントを受け付けていません

Predicting Species Occurrence Patterns from Partial Observations

要約 相互に関連する生物多様性と気候危機に対処するには、種がどこで発生し、そのパ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, q-bio.PE | Predicting Species Occurrence Patterns from Partial Observations はコメントを受け付けていません

Img2Loc: Revisiting Image Geolocalization using Multi-modality Foundation Models and Image-based Retrieval-Augmented Generation

要約 画像から正確な位置を地理位置特定することは、コンピュータ ビジョンと情報検 … 続きを読む

カテゴリー: cs.AI, cs.CV | Img2Loc: Revisiting Image Geolocalization using Multi-modality Foundation Models and Image-based Retrieval-Augmented Generation はコメントを受け付けていません

Human Gaussian Splatting: Real-time Rendering of Animatable Avatars

要約 この作品は、マルチビュー ビデオから学習したフォトリアリスティックな人体の … 続きを読む

カテゴリー: cs.CV, cs.GR | Human Gaussian Splatting: Real-time Rendering of Animatable Avatars はコメントを受け付けていません

Learned representation-guided diffusion models for large-image generation

要約 忠実度の高いサンプルを合成するには、拡散モデルには通常、生成プロセスをガイ … 続きを読む

カテゴリー: cs.CV | Learned representation-guided diffusion models for large-image generation はコメントを受け付けていません