-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年6月
Enhancing Vision Models for Text-Heavy Content Understanding and Interaction
要約 複数の画像を含むテキストの多いビジュアル コンテンツを操作して理解すること … 続きを読む
Predicting ptychography probe positions using single-shot phase retrieval neural network
要約 タイコグラフィーは、材料科学、生物学、ナノテクノロジーなどのさまざまな分野 … 続きを読む
カテゴリー: 94A08, cs.AI, cs.CV, I.4.0, physics.app-ph, physics.data-an
Predicting ptychography probe positions using single-shot phase retrieval neural network はコメントを受け付けていません
Fast yet Safe: Early-Exiting with Risk Control
要約 機械学習モデルをスケーリングすると、パフォーマンスが大幅に向上します。 た … 続きを読む
Memory Consolidation Enables Long-Context Video Understanding
要約 ほとんどのトランスフォーマーベースのビデオ エンコーダーは、二次的な複雑さ … 続きを読む
カテゴリー: cs.CV
Memory Consolidation Enables Long-Context Video Understanding はコメントを受け付けていません
HQ-DiT: Efficient Diffusion Transformer with FP4 Hybrid Quantization
要約 拡散トランス (DiT) は、U-Net を使用する従来の拡散モデルを上回 … 続きを読む
The Victim and The Beneficiary: Exploiting a Poisoned Model to Train a Clean Model on Poisoned Data
要約 最近、バックドア攻撃がディープ ニューラル ネットワーク (DNN) のト … 続きを読む
カテゴリー: cs.CV
The Victim and The Beneficiary: Exploiting a Poisoned Model to Train a Clean Model on Poisoned Data はコメントを受け付けていません
Towards Imbalanced Motion: Part-Decoupling Network for Video Portrait Segmentation
要約 ビデオ ポートレート セグメンテーション (VPS) は、ビデオ フレーム … 続きを読む
カテゴリー: cs.CV
Towards Imbalanced Motion: Part-Decoupling Network for Video Portrait Segmentation はコメントを受け付けていません
Behind Every Domain There is a Shift: Adapting Distortion-aware Vision Transformers for Panoramic Semantic Segmentation
要約 この論文では、次の 2 つの重要な課題のために十分に研究されていないパノラ … 続きを読む
Pre- to Post-Contrast Breast MRI Synthesis for Enhanced Tumour Segmentation
要約 ダイナミック造影 MRI (DCE-MRI) における造影剤の投与は、腫瘍 … 続きを読む
Amortizing intractable inference in diffusion models for vision, language, and control
要約 拡散モデルは、視覚、言語、強化学習における効果的な分布推定器として登場しま … 続きを読む