-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Iterative Length-Regularized Direct Preference Optimization: A Case Study on Improving 7B Language Models to GPT-4 Level
要約 言語モデルを人間の好みに合わせるための標準的な方法である直接好み最適化 ( … 続きを読む
Embodied Instruction Following in Unknown Environments
要約 身体化されたエージェントが自然言語から人間による複雑な指示を完了できるよう … 続きを読む
WPO: Enhancing RLHF with Weighted Preference Optimization
要約 ヒューマン フィードバックからの強化学習 (RLHF) は、大規模言語モデ … 続きを読む
Language Modeling with Editable External Knowledge
要約 世界が変われば、それについて人間が書く文章も変わります。 これらの変更を反 … 続きを読む
YOLO-FEDER FusionNet: A Novel Deep Learning Architecture for Drone Detection
要約 画像ベースのドローン検出の主流の方法は、YOLOv5 のような汎用の物体検 … 続きを読む
Evaluating Task-based Effectiveness of MLLMs on Charts
要約 このペーパーでは、GPT-4V はチャート上の低レベルのデータ分析タスクに … 続きを読む
See It from My Perspective: Diagnosing the Western Cultural Bias of Large Vision-Language Models in Image Understanding
要約 ビジョン言語モデル (VLM) は、多くの言語の画像に関するクエリに応答で … 続きを読む
Deep Learning methodology for the identification of wood species using high-resolution macroscopic images
要約 持続可能な木材取引を支援するには、世界中で木材種の識別の分野で大幅な進歩が … 続きを読む
Task Me Anything
要約 大規模なマルチモーダル言語モデル (MLM) のベンチマークは、特定の機能 … 続きを読む
A Brief Survey on Leveraging Large Scale Vision Models for Enhanced Robot Grasping
要約 ロボットによる把持は、現実世界のシナリオでは困難な運動タスクを提示しており … 続きを読む