-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Real-World Robot Applications of Foundation Models: A Review
要約 大規模言語モデル (LLM) やビジョン言語モデル (VLM) などの基礎 … 続きを読む
Jacquard V2: Refining Datasets using the Human In the Loop Data Correction Method
要約 産業オートメーションの急速な進歩の中で、視覚ベースのロボットによる把握はま … 続きを読む
InkSight: Offline-to-Online Handwriting Conversion by Learning to Read and Write
要約 デジタル メモの作成は人気が高まっており、デジタル インクと呼ばれるベクト … 続きを読む
You Only Need One Color Space: An Efficient Network for Low-light Image Enhancement
要約 低光量画像強化 (LLIE) タスクは、破損した低光量画像から詳細と視覚情 … 続きを読む
FusionSF: Fuse Heterogeneous Modalities in a Vector Quantized Framework for Robust Solar Power Forecasting
要約 太陽光発電所を電力網に統合し、計画を立てて電力網の安全性を確保するには、正 … 続きを読む
How to train your VAE
要約 変分オートエンコーダ (VAE) は、機械学習における生成モデリングと表現 … 続きを読む
CREMA: Multimodal Compositional Video Reasoning via Efficient Modular Adaptation and Fusion
要約 マルチモーダル構成推論アプローチは目覚ましい進歩を遂げていますが、多くのモ … 続きを読む
ClickSAM: Fine-tuning Segment Anything Model using click prompts for ultrasound image segmentation
要約 新しくリリースされた Segment Anything Model (SA … 続きを読む
カテゴリー: cs.AI, cs.CV, physics.med-ph
ClickSAM: Fine-tuning Segment Anything Model using click prompts for ultrasound image segmentation はコメントを受け付けていません
SPHINX-X: Scaling Data and Parameters for a Family of Multi-modal Large Language Models
要約 私たちは、SPHINX をベースに開発された広範なマルチモダリティ大規模言 … 続きを読む
How Far Can Fairness Constraints Help Recover From Biased Data?
要約 公平な分類に対する一般的な考えは、公平性の制約により精度とのトレードオフが … 続きを読む