-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
PIF: Anomaly detection via preference embedding
要約 構造化されたパターンに関する異常を検出する問題に対処します。 この目的のた … 続きを読む
Vision language models have difficulty recognizing virtual objects
要約 Vision Language Models(VLMS)は、Multimo … 続きを読む
SEAL: Searching Expandable Architectures for Incremental Learning
要約 インクリメンタル学習は、モデルがタスクの連続ストリームから学習する機械学習 … 続きを読む
UniEval: Unified Holistic Evaluation for Unified Multimodal Understanding and Generation
要約 統一されたマルチモーダルの理解と生成モデルの出現は、モデルの冗長性を最小限 … 続きを読む
Multi-Token Prediction Needs Registers
要約 マルチトークンの予測は、言語モデルの事前トレーニングを改善するための有望な … 続きを読む
Does Feasibility Matter? Understanding the Impact of Feasibility on Synthetic Training Data
要約 光リアリックな拡散モデルの開発により、合成データで部分的または完全にトレー … 続きを読む
MathCoder-VL: Bridging Vision and Code for Enhanced Multimodal Mathematical Reasoning
要約 大規模なマルチモーダルモデルのトレーニングに広く使用されている自然言語画像 … 続きを読む
FAMMA: A Benchmark for Financial Domain Multilingual Multimodal Question Answering
要約 この論文では、\ underline {a} ncial \ underl … 続きを読む
Construction and Application of Materials Knowledge Graph in Multidisciplinary Materials Science via Large Language Model
要約 材料科学の知識は、広範な科学文献全体に広く分散されており、新しい材料の効率 … 続きを読む