-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年4月
MBE-ARI: A Multimodal Dataset Mapping Bi-directional Engagement in Animal-Robot Interaction
要約 ロボットは、ボディーランゲージ、動き、発声などの動物の複雑でマルチモーダル … 続きを読む
A Multi-Modal AI System for Screening Mammography: Integrating 2D and 3D Imaging to Improve Breast Cancer Detection in a Prospective Clinical Study
要約 デジタル乳房トモシンセシス(DBT)は、フルフィールドデジタルマンモグラフ … 続きを読む
The Invisible EgoHand: 3D Hand Forecasting through EgoBody Pose Estimation
要約 エゴセントリックな視点からの手の動きとポーズを予測することは、人間の意図を … 続きを読む
カテゴリー: cs.CV
The Invisible EgoHand: 3D Hand Forecasting through EgoBody Pose Estimation はコメントを受け付けていません
Fine-Grained Retrieval-Augmented Generation for Visual Question Answering
要約 視覚的な質問回答(VQA)は、画像からの情報を利用することにより、自然言語 … 続きを読む
X2BR: High-Fidelity 3D Bone Reconstruction from a Planar X-Ray Image with Hybrid Neural Implicit Methods
要約 単一の平面X線からの正確な3D骨再建は、解剖学的複雑さと限られた入力データ … 続きを読む
カテゴリー: cs.CV
X2BR: High-Fidelity 3D Bone Reconstruction from a Planar X-Ray Image with Hybrid Neural Implicit Methods はコメントを受け付けていません
HRDecoder: High-Resolution Decoder Network for Fundus Image Lesion Segmentation
要約 Fundus画像の正確なセグメンテーションには高解像度が重要ですが、高解像 … 続きを読む
カテゴリー: cs.CV
HRDecoder: High-Resolution Decoder Network for Fundus Image Lesion Segmentation はコメントを受け付けていません
UNEM: UNrolled Generalized EM for Transductive Few-Shot Learning
要約 トランスダクトの少数のショット学習は、最近、コンピュータービジョンにおいて … 続きを読む
カテゴリー: cs.CV
UNEM: UNrolled Generalized EM for Transductive Few-Shot Learning はコメントを受け付けていません
Seaweed-7B: Cost-Effective Training of Video Generation Foundation Model
要約 このテクニカルレポートは、ビデオジェネレーションファンデーションモデルをト … 続きを読む
Hypergraph Vision Transformers: Images are More than Nodes, More than Edges
要約 コンピュータービジョンの最近の進歩により、さまざまなタスクにわたる視覚変圧 … 続きを読む
カテゴリー: cs.CV
Hypergraph Vision Transformers: Images are More than Nodes, More than Edges はコメントを受け付けていません
Generating Fine Details of Entity Interactions
要約 画像は、オブジェクトを描写するだけでなく、それらの間の豊富な相互作用もカプ … 続きを読む