-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Evaluating Modern Visual Anomaly Detection Approaches in Semiconductor Manufacturing: A Comparative Study
要約 半導体製造は、複雑で多段階のプロセスです。 走査型電子顕微鏡(SEM)画像 … 続きを読む
Neural Brain: A Neuroscience-inspired Framework for Embodied Agents
要約 人工知能(AI)の急速な進化は、静的なデータ駆動型モデルから、実際の環境を … 続きを読む
Simple Semi-supervised Knowledge Distillation from Vision-Language Models via $\mathbf{\texttt{D}}$ual-$\mathbf{\texttt{H}}$ead $\mathbf{\texttt{O}}$ptimization
要約 Vision-Language Models(VLMS)は、最小限のラベル … 続きを読む
Hybrid Spiking Vision Transformer for Object Detection with Event Cameras
要約 イベントベースのオブジェクト検出は、高い時間分解能、広いダイナミックレンジ … 続きを読む
GP-GS: Gaussian Processes for Enhanced Gaussian Splatting
要約 3Dガウスのスプラッティングは、効率的なフォトリアリスティックな新規ビュー … 続きを読む
DexWild: Dexterous Human Interactions for In-the-Wild Robot Policies
要約 大規模で多様なロボットデータセットは、目覚る操作ポリシーが新しい環境に一般 … 続きを読む
Prompt to Polyp: Medical Text-Conditioned Image Synthesis with Diffusion Models
要約 テキストの説明から現実的な医療画像の生成は、患者のプライバシーを維持しなが … 続きを読む
H$^{\mathbf{3}}$DP: Triply-Hierarchical Diffusion Policy for Visuomotor Learning
要約 視覚運動の政策学習は、ロボット操作の大きな進歩を目撃しており、最近のアプロ … 続きを読む
LLMs Outperform Experts on Challenging Biology Benchmarks
要約 この研究では、分子生物学、遺伝学、クローニング、ウイルス学、およびバイオセ … 続きを読む
CityNavAgent: Aerial Vision-and-Language Navigation with Hierarchical Semantic Planning and Global Memory
要約 自然言語の指示を解釈し、複雑な都市環境をナビゲートするためにドローンを要求 … 続きを読む