-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年5月
Test-Time Adaptation for Depth Completion
要約 一部の (ソース) データセットでトレーニングされたモデルをターゲットのテ … 続きを読む
EVA-X: A Foundation Model for General Chest X-ray Analysis with Self-supervised Learning
要約 胸部疾患の診断と治療は、人間の健康を維持する上で重要な役割を果たします。 … 続きを読む
カテゴリー: cs.CV
EVA-X: A Foundation Model for General Chest X-ray Analysis with Self-supervised Learning はコメントを受け付けていません
BenthicNet: A global compilation of seafloor images for deep learning applications
要約 水中イメージングの進歩により、重要な底生生態系の監視に必要な広範な海底画像 … 続きを読む
D4C Glove-train: Solving the RPM and Bongard-logo Problem by Circumscribing and Building Distribution for Concepts
要約 この論文は、抽象推論の領域、特に Raven の Progressive … 続きを読む
カテゴリー: cs.CV
D4C Glove-train: Solving the RPM and Bongard-logo Problem by Circumscribing and Building Distribution for Concepts はコメントを受け付けていません
Attention-Driven Training-Free Efficiency Enhancement of Diffusion Models
要約 拡散モデル (DM) は、高品質で多様な画像を生成する際に優れたパフォーマ … 続きを読む
THRONE: An Object-based Hallucination Benchmark for the Free-form Generations of Large Vision-Language Models
要約 大規模視覚言語モデル (LVLM) における幻覚の軽減は依然として未解決の … 続きを読む
Multi-Modal Data-Efficient 3D Scene Understanding for Autonomous Driving
要約 自動運転における 3D シーンの理解を進めるには、データの効率的な利用が不 … 続きを読む
OpenESS: Event-based Semantic Scene Understanding with Open Vocabularies
要約 イベントベースのセマンティック セグメンテーション (ESS) は、イベン … 続きを読む
DistGrid: Scalable Scene Reconstruction with Distributed Multi-resolution Hash Grid
要約 Neural Radiance Field~(NeRF) は、オブジェクト … 続きを読む
カテゴリー: cs.CV
DistGrid: Scalable Scene Reconstruction with Distributed Multi-resolution Hash Grid はコメントを受け付けていません
Inf-DiT: Upsampling Any-Resolution Image with Memory-Efficient Diffusion Transformer
要約 近年、拡散モデルは画像生成において目覚ましい性能を発揮しています。 ただし … 続きを読む
カテゴリー: cs.CV
Inf-DiT: Upsampling Any-Resolution Image with Memory-Efficient Diffusion Transformer はコメントを受け付けていません