-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Static IR Drop Prediction with Attention U-Net and Saliency-Based Explainability
要約 最近、ニューラル ネットワークを使用した静的 IR ドロップ解析と、画像間 … 続きを読む
KaPO: Knowledge-aware Preference Optimization for Controllable Knowledge Selection in Retrieval-Augmented Language Models
要約 外部知識を統合することにより、検索拡張生成 (RAG) は、知識集約型タス … 続きを読む
Understanding How Blind Users Handle Object Recognition Errors: Strategies and Challenges
要約 物体認識テクノロジーは、目の見えない人や弱視の人が周囲の世界を移動できるよ … 続きを読む
Training LLMs to Recognize Hedges in Spontaneous Narratives
要約 ヘッジを使用すると、話者は、非原型性または「あいまいさ」を示すかどうか、発 … 続きを読む
MoMa: Efficient Early-Fusion Pre-training with Mixture of Modality-Aware Experts
要約 混合モーダルの初期融合言語モデルを事前トレーニングするために設計された、新 … 続きを読む
FBSDiff: Plug-and-Play Frequency Band Substitution of Diffusion Features for Highly Controllable Text-Driven Image Translation
要約 大規模なテキストから画像への拡散モデルは、生成 AI とマルチモーダル テ … 続きを読む
Dilated Convolution with Learnable Spacings makes visual models more aligned with humans: a Grad-CAM study
要約 Dirated Convolution with Learningable … 続きを読む
Personalizing Federated Instrument Segmentation with Visual Trait Priors in Robotic Surgery
要約 手術器具セグメンテーション (SIS) のためのパーソナライズされたフェデ … 続きを読む
カテゴリー: cs.AI, cs.CV, cs.RO, physics.med-ph
Personalizing Federated Instrument Segmentation with Visual Trait Priors in Robotic Surgery はコメントを受け付けていません
VCHAR:Variance-Driven Complex Human Activity Recognition framework with Generative Representation
要約 複雑な人間活動認識 (CHAR) は、ユビキタス コンピューティング、特に … 続きを読む
GAOKAO-MM: A Chinese Human-Level Benchmark for Multimodal Models Evaluation
要約 Large Vision-Language Model (LVLM) は、 … 続きを読む