-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Discriminating image representations with principal distortions
要約 画像表現(人工的または生物学的)は、多くの場合、グローバルな幾何学的構造の … 続きを読む
GIE-Bench: Towards Grounded Evaluation for Text-Guided Image Editing
要約 自然言語の指示を使用した画像の編集は、視覚的なコンテンツを変更する自然で表 … 続きを読む
カテゴリー: cs.CV
GIE-Bench: Towards Grounded Evaluation for Text-Guided Image Editing はコメントを受け付けていません
QVGen: Pushing the Limit of Quantized Video Generative Models
要約 ビデオ拡散モデル(DMS)により、高品質のビデオ統合が可能になりました。 … 続きを読む
カテゴリー: cs.CV
QVGen: Pushing the Limit of Quantized Video Generative Models はコメントを受け付けていません
UniSkill: Imitating Human Videos via Cross-Embodiment Skill Representations
要約 模倣は人間の基本的な学習メカニズムであり、個人が専門家を観察し模倣すること … 続きを読む
Large-Scale Gaussian Splatting SLAM
要約 最近開発されたニューラル放射輝度(NERF)および3Dガウススプラッティン … 続きを読む
FlowDreamer: A RGB-D World Model with Flow-based Motion Representations for Robot Manipulation
要約 このペーパーでは、ロボット操作のためのより良い視覚世界モデル、つまり過去の … 続きを読む
Latent Action Pretraining from Videos
要約 General Action Models(LAPA)の潜在的なアクション … 続きを読む
On the Interplay of Human-AI Alignment,Fairness, and Performance Trade-offs in Medical Imaging
要約 深いニューラルネットワークは医療イメージングに優れていますが、バイアスの傾 … 続きを読む
Inferring Driving Maps by Deep Learning-based Trail Map Extraction
要約 高解像度(HD)マップは、運転シーンに関する広範かつ正確な環境情報を提供し … 続きを読む
HandReader: Advanced Techniques for Efficient Fingerspelling Recognition
要約 指の貫通は、手話(SL)の重要な要素であり、署名中の高速手の動きを特徴とす … 続きを読む