-
最近の投稿
- Physical Reservoir Computing in Hook-Shaped Rover Wheel Spokes for Real-Time Terrain Identification
- Chain-of-Modality: Learning Manipulation Programs from Multimodal Human Videos with Vision-Language-Models
- Multi-Sensor Fusion-Based Mobile Manipulator Remote Control for Intelligent Smart Home Assistance
- Integration of a Graph-Based Path Planner and Mixed-Integer MPC for Robot Navigation in Cluttered Environments
- Demonstrating CavePI: Autonomous Exploration of Underwater Caves by Semantic Guidance
-
最近のコメント
表示できるコメントはありません。 cs.AI (36829) cs.CL (27883) cs.CV (42623) cs.HC (2814) cs.LG (41781) cs.RO (21795) cs.SY (3320) eess.IV (4979) eess.SY (3312) stat.ML (5469)
「68T45」カテゴリーアーカイブ
Explicit and Implicit Representations in AI-based 3D Reconstruction for Radiology: A systematic literature review
要約 臨床診療と診断支援における高品質の医療イメージングの需要により、放射線イメ … 続きを読む
From Gaze to Insight: Bridging Human Visual Attention and Vision Language Model Explanation for Weakly-Supervised Medical Image Segmentation
要約 医療画像セグメンテーションは、トレーニング用のピクセルレベルの注釈のコスト … 続きを読む
Intelligent Framework for Human-Robot Collaboration: Dynamic Ergonomics and Adaptive Decision-Making
要約 産業環境への共同ロボットの統合により、生産性が向上しましたが、オペレーター … 続きを読む
Hodge Laplacians and Hodge Diffusion Maps
要約 Hodge Diffusion Mapsは、高次元データセットからトポロジ … 続きを読む
SF2T: Self-supervised Fragment Finetuning of Video-LLMs for Fine-Grained Understanding
要約 ビデオベースの大規模な言語モデル(ビデオ-LLM)は、マルチモーダルLLM … 続きを読む
BUFF: Bayesian Uncertainty Guided Diffusion Probabilistic Model for Single Image Super-Resolution
要約 超解像(SR)技術は、特に高解像度画像が不可欠でありながらハードウェアの制 … 続きを読む
Vision-Language Models for Acute Tuberculosis Diagnosis: A Multimodal Approach Combining Imaging and Clinical Data
要約 背景:この研究では、自動化された急性結核(TB)スクリーニングのためのSi … 続きを読む
Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models
要約 自律運転における共変量シフト問題に対処するために、潜在空間生成世界モデルの … 続きを読む
Socratic Planner: Self-QA-Based Zero-Shot Planning for Embodied Instruction Following
要約 次の具体化された命令(EIF)は、インタラクティブな環境でオブジェクトをナ … 続きを読む
Harmony: A Joint Self-Supervised and Weakly-Supervised Framework for Learning General Purpose Visual Representations
要約 クリップなどのビジョン言語対照学習フレームワークは、自然言語の監督から学習 … 続きを読む