-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Opening Articulated Structures in the Real World
要約 以前に見えなかった環境で、以前に見えなかったオブジェクトで有能に動作できる … 続きを読む
LRFusionPR: A Polar BEV-Based LiDAR-Radar Fusion Network for Place Recognition
要約 自律運転では、GPSが除去した環境におけるグローバルなローカリゼーションに … 続きを読む
MonoForce: Learnable Image-conditioned Physics Engine
要約 オンボードカメラの画像からの大まかなオフロード地形でのロボット軌跡の予測の … 続きを読む
RoBridge: A Hierarchical Architecture Bridging Cognition and Execution for General Robotic Manipulation
要約 多様なタスクを備えたオープンエンドシナリオでのオペレーティングロボットは、 … 続きを読む
RGB-Event Fusion with Self-Attention for Collision Prediction
要約 動的で現実世界の環境での自律的なロボットの安全な動作には、堅牢でリアルタイ … 続きを読む
Cyclic Vision-Language Manipulator: Towards Reliable and Fine-Grained Image Interpretation for Automated Report Generation
要約 自動化されたレポート生成の大幅な進歩にもかかわらず、テキストの解釈可能性の … 続きを読む
Advancements and limitations of LLMs in replicating human color-word associations
要約 カラーワードの関連付けは、人間の認知および設計アプリケーションにおいて基本 … 続きを読む
RaDialog: A Large Vision-Language Model for Radiology Report Generation and Conversational Assistance
要約 特定の医療イメージの臨床的に修正された放射線レポートを生成および議論するこ … 続きを読む
VideoPath-LLaVA: Pathology Diagnostic Reasoning Through Video Instruction Tuning
要約 3つの異なる画像シナリオ、シングルパッチ画像、自動的にキーフレーム抽出され … 続きを読む
EcoWeedNet: A Lightweight and Automated Weed Detection Method for Sustainable Next-Generation Agricultural Consumer Electronics
要約 持続可能な農業は、消費者の世界の食料安全保障を確保する上で重要な役割を果た … 続きを読む