-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
End-To-End Underwater Video Enhancement: Dataset and Model
要約 水中ビデオ強化 (UVE) は、水中ビデオの視認性とフレーム品質を向上させ … 続きを読む
LeTO: Learning Constrained Visuomotor Policy with Differentiable Trajectory Optimization
要約 この論文では、微分可能軌道最適化を介して制約付き視覚運動ポリシーを学習する … 続きを読む
Effectiveness Assessment of Recent Large Vision-Language Models
要約 大規模ビジョン言語モデル (LVLM) の出現は、汎用人工知能の追求に向け … 続きを読む
OCR is All you need: Importing Multi-Modality into Image-based Defect Detection System
要約 自動光学検査 (AOI) は製造プロセスにおいて極めて重要な役割を果たして … 続きを読む
Global $\mathcal{L}^2$ minimization at uniform exponential rate via geometrically adapted gradient descent in Deep Learning
要約 深層学習ネットワークで $\mathcal{L}^2$ コスト関数の最小化 … 続きを読む
Quiet-STaR: Language Models Can Teach Themselves to Think Before Speaking
要約 書いたり話したりするとき、人は時々立ち止まって考えることがあります。 推論 … 続きを読む
LLM^3:Large Language Model-based Task and Motion Planning with Motion Failure Reasoning
要約 従来のタスクおよびモーション プランニング (TAMP) アプローチは、シ … 続きを読む
Reinforcement Learning with Token-level Feedback for Controllable Text Generation
要約 実際のアプリケーションの要件を満たすには、大規模言語モデル (LLM) の … 続きを読む
UniRepLKNet: A Universal Perception Large-Kernel ConvNet for Audio, Video, Point Cloud, Time-Series and Image Recognition
要約 ラージカーネル畳み込みニューラル ネットワーク (ConvNets) は最 … 続きを読む
ProMISe: Promptable Medical Image Segmentation using SAM
要約 Segment Anything Model (SAM) の提案により、医 … 続きを読む