-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Multi-Head Explainer: A General Framework to Improve Explainability in CNNs and Transformers
要約 本研究では、畳み込みニューラルネットワーク(CNN)とTransforme … 続きを読む
ViGiL3D: A Linguistically Diverse Dataset for 3D Visual Grounding
要約 3Dビジュアルグラウンディング(3DVG)は、自然言語テキストによって参照 … 続きを読む
ScarNet: A Novel Foundation Model for Automated Myocardial Scar Quantification from LGE in Cardiac MRI
要約 背景後期ガドリニウム増強(LGE)画像は心筋線維化と瘢痕を評価するためのゴ … 続きを読む
Training Medical Large Vision-Language Models with Abnormal-Aware Feedback
要約 既存の医療用大型視覚言語モデル(Medical Large Vision- … 続きを読む
On Unifying Video Generation and Camera Pose Estimation
要約 画像生成における3D機能の出現に触発され、ビデオ生成も同様に3D認識を示す … 続きを読む
Multi-Modal Video Feature Extraction for Popularity Prediction
要約 この研究は、動画そのものとそれに関連する特徴を用いて、短い動画の人気を予測 … 続きを読む
Object-level Visual Prompts for Compositional Image Generation
要約 我々は、テキストから画像への拡散モデルの中で、オブジェクトレベルの視覚的プ … 続きを読む
An LSTM Feature Imitation Network for Hand Movement Recognition from sEMG Signals
要約 表面筋電図 (sEMG) は、手の動きのパターンの認識、病気の診断、プロテ … 続きを読む
Speeding Up Path Planning via Reinforcement Learning in MCTS for Automated Parking
要約 この論文では、強化学習をモンテカルロ木探索に統合して、自動駐車タスクのため … 続きを読む
SynH2R: Synthesizing Hand-Object Motions for Learning Human-to-Robot Handovers
要約 視覚ベースの人間からロボットへのハンドオーバーは、人間とロボットのインタラ … 続きを読む