月別アーカイブ: 2024年3月

SkillDiffuser: Interpretable Hierarchical Planning via Skill Abstractions in Diffusion-Based Task Execution

投稿日: 2024年3月29日作成者: jarxiv

要約普及モデルは、ロボットの軌道計画に大きな可能性を秘めていることが実証されて … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.RO | コメントを受け付けていません

MANUS: Markerless Grasp Capture using Articulated 3D Gaussians

投稿日: 2024年3月29日作成者: jarxiv

要約私たちが手で物体をつかむ方法を理解することは、ロボット工学や複合現実などの … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Parameter Efficient Fine-tuning via Cross Block Orchestration for Segment Anything Model

投稿日: 2024年3月29日作成者: jarxiv

要約パラメーター効率の良い微調整 (PEFT) は、トレーニングデータが限ら … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Towards Generalizable Tumor Synthesis

投稿日: 2024年3月29日作成者: jarxiv

要約腫瘍合成により、医療画像内に人工腫瘍を作成できるようになり、腫瘍の検出とセ … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

The Bad Batches: Enhancing Self-Supervised Learning in Image Classification Through Representative Batch Curation

投稿日: 2024年3月29日作成者: jarxiv

要約人間の監督なしで堅牢な表現を学習することの追求は、長年の課題です。自己教 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

OV-Uni3DETR: Towards Unified Open-Vocabulary 3D Object Detection via Cycle-Modality Propagation

投稿日: 2024年3月29日作成者: jarxiv

要約 3D オブジェクト検出研究の現状では、注釈付き 3D データの深刻な不足、 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Predicting Species Occurrence Patterns from Partial Observations

投稿日: 2024年3月29日作成者: jarxiv

要約相互に関連する生物多様性と気候危機に対処するには、種がどこで発生し、そのパ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, q-bio.PE | コメントを受け付けていません

Img2Loc: Revisiting Image Geolocalization using Multi-modality Foundation Models and Image-based Retrieval-Augmented Generation

投稿日: 2024年3月29日作成者: jarxiv

要約画像から正確な位置を地理位置特定することは、コンピュータビジョンと情報検 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Human Gaussian Splatting: Real-time Rendering of Animatable Avatars

投稿日: 2024年3月29日作成者: jarxiv

要約この作品は、マルチビュービデオから学習したフォトリアリスティックな人体の … 続きを読む →

カテゴリー: cs.CV, cs.GR | コメントを受け付けていません

Learned representation-guided diffusion models for large-image generation

投稿日: 2024年3月29日作成者: jarxiv

要約忠実度の高いサンプルを合成するには、拡散モデルには通常、生成プロセスをガイ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2024年3月

SkillDiffuser: Interpretable Hierarchical Planning via Skill Abstractions in Diffusion-Based Task Execution

MANUS: Markerless Grasp Capture using Articulated 3D Gaussians

Parameter Efficient Fine-tuning via Cross Block Orchestration for Segment Anything Model

Towards Generalizable Tumor Synthesis

The Bad Batches: Enhancing Self-Supervised Learning in Image Classification Through Representative Batch Curation

OV-Uni3DETR: Towards Unified Open-Vocabulary 3D Object Detection via Cycle-Modality Propagation

Predicting Species Occurrence Patterns from Partial Observations

Img2Loc: Revisiting Image Geolocalization using Multi-modality Foundation Models and Image-based Retrieval-Augmented Generation

Human Gaussian Splatting: Real-time Rendering of Animatable Avatars

Learned representation-guided diffusion models for large-image generation

最近の投稿

最近のコメント

アーカイブ

カテゴリー