-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Solving Drone Routing Problems with Quantum Computing: A Hybrid Approach Combining Quantum Annealing and Gate-Based Paradigms
要約 このペーパーでは、量子コンピューティングの機能を活用することにより、実際の … 続きを読む
A Schema-Guided Reason-while-Retrieve framework for Reasoning on Scene Graphs with Large-Language-Models (LLMs)
要約 シーングラフは、大きな言語モデル(LLM)を使用した接地された空間推論のた … 続きを読む
Adapt-Pruner: Adaptive Structural Pruning for Efficient Small Language Model Training
要約 小言語モデル(SLM)は、エッジデバイスでの幅広いアプリケーションのため、 … 続きを読む
Tell2Reg: Establishing spatial correspondence between images by the same language prompts
要約 空間的対応は、セグメント化された領域のペアで表すことができ、画像登録ネット … 続きを読む
ImgTrojan: Jailbreaking Vision-Language Models with ONE Image
要約 大規模な言語モデル(LLMS)の人間の価値の調整に関心が高まっています。 … 続きを読む
iVISPAR — An Interactive Visual-Spatial Reasoning Benchmark for VLMs
要約 Vision-Language Models (VLMs) are kno … 続きを読む
Learnable Expansion of Graph Operators for Multi-Modal Feature Fusion
要約 コンピュータービジョンのタスクでは、機能は多様な表現、ドメイン(屋内や屋外 … 続きを読む
Long-tailed Medical Diagnosis with Relation-aware Representation Learning and Iterative Classifier Calibration
要約 最近、コンピューター支援診断により、有望なパフォーマンスが実証されており、 … 続きを読む
When Pre-trained Visual Representations Fall Short: Limitations in Visuo-Motor Robot Learning
要約 事前に訓練された視覚表現(PVR)が視覚エンコーダーをゼロからトレーニング … 続きを読む
Deep Learning Pipeline for Fully Automated Myocardial Infarct Segmentation from Clinical Cardiac MR Scans
要約 目的:完全に自動化された方法で心筋梗塞セグメンテーションを実行できる深い学 … 続きを読む