-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
Show-o2: Improved Native Unified Multimodal Models
要約 このホワイトペーパーでは、自動網性モデリングとフローマッチングを活用する改 … 続きを読む
Baltimore Atlas: FreqWeaver Adapter for Semi-supervised Ultra-high Spatial Resolution Land Cover Classification
要約 超高空間解像度の土地被覆分類は、きめ細かい土地被覆分析には不可欠ですが、ピ … 続きを読む
A Unified Graph-based Framework for Scalable 3D Tree Reconstruction and Non-Destructive Biomass Estimation from Point Clouds
要約 地上森林のバイオマス(AGB)の推定は、炭素貯蔵を評価し、持続可能な森林管 … 続きを読む
TARDIS STRIDE: A Spatio-Temporal Road Image Dataset and World Model for Autonomy
要約 世界モデルは、環境をシミュレートし、効果的なエージェントの動作を可能にする … 続きを読む
RDD: Robust Feature Detector and Descriptor using Deformable Transformer
要約 構造からのストレートとスラムの中心的なステップとして、大幅な視点の変化など … 続きを読む
One-Step Diffusion for Detail-Rich and Temporally Consistent Video Super-Resolution
要約 特に、現実的な詳細合成のために安定した拡散(SD)などの事前に訓練された生 … 続きを読む
Mono-Modalizing Extremely Heterogeneous Multi-Modal Medical Image Registration
要約 臨床診療では、陽電子放出断層撮影(PET)や分数異方性(FA)などの機能的 … 続きを読む
VideoHallu: Evaluating and Mitigating Multi-modal Hallucinations on Synthetic Video Understanding
要約 合成ビデオ生成は、そのリアリズムと幅広いアプリケーションに対して大きな注目 … 続きを読む
A dataset of high-resolution plantar pressures for gait analysis across varying footwear and walking speeds
要約 歩行とは、歩行中に生成される四肢の動きのパターンを指します。これは、物理的 … 続きを読む
I2I-Mamba: Multi-modal medical image synthesis via selective state space modeling
要約 マルチモーダルの医療画像合成には、ソースとターゲットモダリティの間の組織シ … 続きを読む