-
最近の投稿
- Physical Reservoir Computing in Hook-Shaped Rover Wheel Spokes for Real-Time Terrain Identification
- Chain-of-Modality: Learning Manipulation Programs from Multimodal Human Videos with Vision-Language-Models
- Multi-Sensor Fusion-Based Mobile Manipulator Remote Control for Intelligent Smart Home Assistance
- Integration of a Graph-Based Path Planner and Mixed-Integer MPC for Robot Navigation in Cluttered Environments
- Demonstrating CavePI: Autonomous Exploration of Underwater Caves by Semantic Guidance
-
最近のコメント
表示できるコメントはありません。 cs.AI (36829) cs.CL (27883) cs.CV (42623) cs.HC (2814) cs.LG (41781) cs.RO (21795) cs.SY (3320) eess.IV (4979) eess.SY (3312) stat.ML (5469)
「cs.CV」カテゴリーアーカイブ
EyecareGPT: Boosting Comprehensive Ophthalmology Understanding with Tailored Dataset, Benchmark and Model
要約 医療大規模な視覚言語モデル(MED-LVLMS)は、ヘルスケアの重要な可能 … 続きを読む
Energy-Latency Attacks via Sponge Poisoning
要約 スポンジの例は、ハードウェアアクセラレータに展開されたディープネットワーク … 続きを読む
Robust image classification with multi-modal large language models
要約 深いニューラルネットワークは、敵対的な例に対して脆弱です。つまり、モデルに … 続きを読む
An OpenMind for 3D medical vision self-supervised learning
要約 3D医療画像の自己教師学習(SSL)の分野には、一貫性と標準化がありません … 続きを読む
MambaMIM: Pre-training Mamba with State Space Token Interpolation and its Application to Medical Image Segmentation
要約 最近、州の宇宙モデルMAMBAは、特に3D医療イメージングにおける長シーケ … 続きを読む
AnyTSR: Any-Scale Thermal Super-Resolution for UAV
要約 熱イメージングは、挑戦的な環境でのインテリジェントな無人航空機(UAV … 続きを読む
Analysing the Robustness of Vision-Language-Models to Common Corruptions
要約 Vision-Language Models(VLMS)は、視覚的およびテ … 続きを読む
Zebrafish Counting Using Event Stream Data
要約 ゼブラフィッシュは、人間の遺伝子と高度な相同性を共有しており、生物医学研究 … 続きを読む
Green Robotic Mixed Reality with Gaussian Splatting
要約 ロボットミックスリアリティ(ROBOMR)システムでのグリーンコミュニケー … 続きを読む
Part-aware Shape Generation with Latent 3D Diffusion of Neural Voxel Fields
要約 このペーパーでは、正確なパート認識構造を実現することを目的とした、神経ボク … 続きを読む