cs.CV」カテゴリーアーカイブ

Discriminating image representations with principal distortions

要約 画像表現(人工的または生物学的)は、多くの場合、グローバルな幾何学的構造の … 続きを読む

カテゴリー: cs.CV, cs.LG, q-bio.NC, stat.ML | Discriminating image representations with principal distortions はコメントを受け付けていません

GIE-Bench: Towards Grounded Evaluation for Text-Guided Image Editing

要約 自然言語の指示を使用した画像の編集は、視覚的なコンテンツを変更する自然で表 … 続きを読む

カテゴリー: cs.CV | GIE-Bench: Towards Grounded Evaluation for Text-Guided Image Editing はコメントを受け付けていません

QVGen: Pushing the Limit of Quantized Video Generative Models

要約 ビデオ拡散モデル(DMS)により、高品質のビデオ統合が可能になりました。 … 続きを読む

カテゴリー: cs.CV | QVGen: Pushing the Limit of Quantized Video Generative Models はコメントを受け付けていません

UniSkill: Imitating Human Videos via Cross-Embodiment Skill Representations

要約 模倣は人間の基本的な学習メカニズムであり、個人が専門家を観察し模倣すること … 続きを読む

カテゴリー: cs.CV, cs.RO | UniSkill: Imitating Human Videos via Cross-Embodiment Skill Representations はコメントを受け付けていません

Large-Scale Gaussian Splatting SLAM

要約 最近開発されたニューラル放射輝度(NERF)および3Dガウススプラッティン … 続きを読む

カテゴリー: cs.CV, cs.RO | Large-Scale Gaussian Splatting SLAM はコメントを受け付けていません

FlowDreamer: A RGB-D World Model with Flow-based Motion Representations for Robot Manipulation

要約 このペーパーでは、ロボット操作のためのより良い視覚世界モデル、つまり過去の … 続きを読む

カテゴリー: cs.CV, cs.RO | FlowDreamer: A RGB-D World Model with Flow-based Motion Representations for Robot Manipulation はコメントを受け付けていません

Latent Action Pretraining from Videos

要約 General Action Models(LAPA)の潜在的なアクション … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG, cs.RO | Latent Action Pretraining from Videos はコメントを受け付けていません

On the Interplay of Human-AI Alignment,Fairness, and Performance Trade-offs in Medical Imaging

要約 深いニューラルネットワークは医療イメージングに優れていますが、バイアスの傾 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | On the Interplay of Human-AI Alignment,Fairness, and Performance Trade-offs in Medical Imaging はコメントを受け付けていません

Inferring Driving Maps by Deep Learning-based Trail Map Extraction

要約 高解像度(HD)マップは、運転シーンに関する広範かつ正確な環境情報を提供し … 続きを読む

カテゴリー: cs.CV, cs.RO | Inferring Driving Maps by Deep Learning-based Trail Map Extraction はコメントを受け付けていません

HandReader: Advanced Techniques for Efficient Fingerspelling Recognition

要約 指の貫通は、手話(SL)の重要な要素であり、署名中の高速手の動きを特徴とす … 続きを読む

カテゴリー: cs.CV, cs.LG | HandReader: Advanced Techniques for Efficient Fingerspelling Recognition はコメントを受け付けていません