cs.AI」カテゴリーアーカイブ

AgentStudio: A Toolkit for Building General Virtual Agents

要約 あらゆるデジタル デバイス上で任意のソフトウェアを使用できる自律型仮想エー … 続きを読む

カテゴリー: cs.AI | AgentStudio: A Toolkit for Building General Virtual Agents はコメントを受け付けていません

LISA: Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning

要約 大規模言語モデル (LLM) が初めて登場して以来、機械学習コミュニティは … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, math.OC | LISA: Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning はコメントを受け付けていません

MAGIS: LLM-Based Multi-Agent Framework for GitHub Issue Resolution

要約 ソフトウェアの進化において、GitHub リポジトリ内で新たに発生した問題 … 続きを読む

カテゴリー: cs.AI, cs.SE | MAGIS: LLM-Based Multi-Agent Framework for GitHub Issue Resolution はコメントを受け付けていません

Simple and Scalable Strategies to Continually Pre-train Large Language Models

要約 大規模言語モデル (LLM) は、数十億のトークンで定期的に事前トレーニン … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Simple and Scalable Strategies to Continually Pre-train Large Language Models はコメントを受け付けていません

MedPromptX: Grounded Multimodal Prompting for Chest X-ray Diagnosis

要約 胸部 X 線画像は、急性および慢性の心肺疾患の予測によく使用されますが、胸 … 続きを読む

カテゴリー: cs.AI, cs.CV | MedPromptX: Grounded Multimodal Prompting for Chest X-ray Diagnosis はコメントを受け付けていません

Evaluating the Efficacy of Prompt-Engineered Large Multimodal Models Versus Fine-Tuned Vision Transformers in Image-Based Security Applications

要約 大規模言語モデル (LLM) の成功により、Gemini-pro などの大 … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.CV | Evaluating the Efficacy of Prompt-Engineered Large Multimodal Models Versus Fine-Tuned Vision Transformers in Image-Based Security Applications はコメントを受け付けていません

Efficient Pre-training for Localized Instruction Generation of Videos

要約 手順ビデオでは、レシピの準備などのタスクを段階的にデモンストレーションしま … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Efficient Pre-training for Localized Instruction Generation of Videos はコメントを受け付けていません

DiffH2O: Diffusion-Based Synthesis of Hand-Object Interactions from Textual Descriptions

要約 3D で自然な手とオブジェクトのインタラクションを生成することは、結果とし … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG | DiffH2O: Diffusion-Based Synthesis of Hand-Object Interactions from Textual Descriptions はコメントを受け付けていません

ReMamber: Referring Image Segmentation with Mamba Twister

要約 トランスフォーマーを利用した参照画像セグメンテーション (RIS) は、複 … 続きを読む

カテゴリー: cs.AI, cs.CV | ReMamber: Referring Image Segmentation with Mamba Twister はコメントを受け付けていません

Hierarchical Open-Vocabulary 3D Scene Graphs for Language-Grounded Robot Navigation

要約 最近のオープンボキャブラリーロボットマッピング手法は、事前にトレーニングさ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | Hierarchical Open-Vocabulary 3D Scene Graphs for Language-Grounded Robot Navigation はコメントを受け付けていません