-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
A Narrative Review of Image Processing Techniques Related to Prostate Ultrasound
要約 前立腺がん(PCa)は男性の健康に重大な脅威をもたらしており、予後の改善と … 続きを読む
Beyond FVD: Enhanced Evaluation Metrics for Video Generation Quality
要約 Fr\’echet Video Distance (FVD) … 続きを読む
Finding Visual Task Vectors
要約 視覚的なプロンプトは、追加のトレーニングを行わずに、コンテキスト内の例を通 … 続きを読む
カテゴリー: cs.CV
Finding Visual Task Vectors はコメントを受け付けていません
Organizing Unstructured Image Collections using Natural Language
要約 非構造化ビジュアル データをセマンティック クラスターに編成することは、コ … 続きを読む
カテゴリー: cs.CV
Organizing Unstructured Image Collections using Natural Language はコメントを受け付けていません
The Dawn of Video Generation: Preliminary Explorations with SORA-like Models
要約 テキストからビデオ (T2V)、画像からビデオ (I2V)、およびビデオか … 続きを読む
カテゴリー: cs.CV
The Dawn of Video Generation: Preliminary Explorations with SORA-like Models はコメントを受け付けていません
3D-free meets 3D priors: Novel View Synthesis from a Single Image with Pretrained Diffusion Guidance
要約 最近の 3D ノベル ビュー合成 (NVS) 手法は、単一オブジェクト中心 … 続きを読む
カテゴリー: cs.CV
3D-free meets 3D priors: Novel View Synthesis from a Single Image with Pretrained Diffusion Guidance はコメントを受け付けていません
Generative Parameter-Efficient Fine-Tuning
要約 事前トレーニングされた Transformer バックボーンをダウンストリ … 続きを読む
SimO Loss: Anchor-Free Contrastive Loss for Fine-Grained Supervised Contrastive Learning
要約 私たちが提案する類似性直交性 (SimO) 損失を活用した、新しいアンカー … 続きを読む
DiffuseReg: Denoising Diffusion Model for Obtaining Deformation Fields in Unsupervised Deformable Image Registration
要約 変形可能な画像位置合わせは、さまざまなモダリティまたは時間からの医療画像を … 続きを読む
カテゴリー: cs.CV
DiffuseReg: Denoising Diffusion Model for Obtaining Deformation Fields in Unsupervised Deformable Image Registration はコメントを受け付けていません
LoTLIP: Improving Language-Image Pre-training for Long Text Understanding
要約 長いテキストを理解することは実際には大きな要求ですが、ほとんどの言語画像事 … 続きを読む
カテゴリー: cs.CV
LoTLIP: Improving Language-Image Pre-training for Long Text Understanding はコメントを受け付けていません