-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
Are Vision-Language Models Ready for Dietary Assessment? Exploring the Next Frontier in AI-Powered Food Image Recognition
要約 食品の画像に基づいた自動食事評価は依然として課題であり、正確な食品検出、セ … 続きを読む
Towards Communication-Efficient Adversarial Federated Learning for Robust Edge Intelligence
要約 Federated Learning(FL)は、生データを公開せずにエッジ … 続きを読む
カテゴリー: cs.CV
Towards Communication-Efficient Adversarial Federated Learning for Robust Edge Intelligence はコメントを受け付けていません
PathSegDiff: Pathology Segmentation using Diffusion model representations
要約 画像セグメンテーションは、正確な疾患診断、サブタイピング、結果、生存可能性 … 続きを読む
カテゴリー: cs.CV
PathSegDiff: Pathology Segmentation using Diffusion model representations はコメントを受け付けていません
A Comparison of Deep Learning Methods for Cell Detection in Digital Cytology
要約 多くの生物医学的画像分析タスクでは、正確で効率的な細胞検出が重要です。 予 … 続きを読む
カテゴリー: cs.CV
A Comparison of Deep Learning Methods for Cell Detection in Digital Cytology はコメントを受け付けていません
VideoChat-R1: Enhancing Spatio-Temporal Perception via Reinforcement Fine-Tuning
要約 補強学習における最近の進歩により、マルチモーダルの大手言語モデル(MLLM … 続きを読む
カテゴリー: cs.CV
VideoChat-R1: Enhancing Spatio-Temporal Perception via Reinforcement Fine-Tuning はコメントを受け付けていません
Two by Two: Learning Multi-Task Pairwise Objects Assembly for Generalizable Robot Manipulation
要約 家具アセンブリやコンポーネントフィッティングなどの3Dアセンブリタスクは、 … 続きを読む
Efficient Self-Supervised Learning for Earth Observation via Dynamic Dataset Curation
要約 自己学習学習(SSL)により、地球観察のためのVision Foundat … 続きを読む
A Deep Single Image Rectification Approach for Pan-Tilt-Zoom Cameras
要約 広角レンズを備えたパンチルトズーム(PTZ)カメラは、監視に広く使用されて … 続きを読む
カテゴリー: cs.CV
A Deep Single Image Rectification Approach for Pan-Tilt-Zoom Cameras はコメントを受け付けていません
Wheat3DGS: In-field 3D Reconstruction, Instance Segmentation and Phenotyping of Wheat Heads with Gaussian Splatting
要約 植物の形態学的特性の自動抽出は、ハイスループットフィールド表現型(HTFP … 続きを読む
カテゴリー: cs.CV
Wheat3DGS: In-field 3D Reconstruction, Instance Segmentation and Phenotyping of Wheat Heads with Gaussian Splatting はコメントを受け付けていません
SIGMAN:Scaling 3D Human Gaussian Generation with Millions of Assets
要約 3D人間のデジタル化は、長い間、非常に追求されているが挑戦的な作業でした。 … 続きを読む
カテゴリー: cs.CV
SIGMAN:Scaling 3D Human Gaussian Generation with Millions of Assets はコメントを受け付けていません