-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
AgentStudio: A Toolkit for Building General Virtual Agents
要約 あらゆるデジタル デバイス上で任意のソフトウェアを使用できる自律型仮想エー … 続きを読む
カテゴリー: cs.AI
AgentStudio: A Toolkit for Building General Virtual Agents はコメントを受け付けていません
LISA: Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning
要約 大規模言語モデル (LLM) が初めて登場して以来、機械学習コミュニティは … 続きを読む
MAGIS: LLM-Based Multi-Agent Framework for GitHub Issue Resolution
要約 ソフトウェアの進化において、GitHub リポジトリ内で新たに発生した問題 … 続きを読む
Simple and Scalable Strategies to Continually Pre-train Large Language Models
要約 大規模言語モデル (LLM) は、数十億のトークンで定期的に事前トレーニン … 続きを読む
MedPromptX: Grounded Multimodal Prompting for Chest X-ray Diagnosis
要約 胸部 X 線画像は、急性および慢性の心肺疾患の予測によく使用されますが、胸 … 続きを読む
Evaluating the Efficacy of Prompt-Engineered Large Multimodal Models Versus Fine-Tuned Vision Transformers in Image-Based Security Applications
要約 大規模言語モデル (LLM) の成功により、Gemini-pro などの大 … 続きを読む
Efficient Pre-training for Localized Instruction Generation of Videos
要約 手順ビデオでは、レシピの準備などのタスクを段階的にデモンストレーションしま … 続きを読む
DiffH2O: Diffusion-Based Synthesis of Hand-Object Interactions from Textual Descriptions
要約 3D で自然な手とオブジェクトのインタラクションを生成することは、結果とし … 続きを読む
ReMamber: Referring Image Segmentation with Mamba Twister
要約 トランスフォーマーを利用した参照画像セグメンテーション (RIS) は、複 … 続きを読む