cs.AI」カテゴリーアーカイブ

Human-Aware Vision-and-Language Navigation: Bridging Simulation to Reality with Dynamic Human Interactions

要約 Vision-and-Language Navigation (VLN) … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Human-Aware Vision-and-Language Navigation: Bridging Simulation to Reality with Dynamic Human Interactions はコメントを受け付けていません

Muffin or Chihuahua? Challenging Multimodal Large Language Models with Multipanel VQA

要約 Web スクリーンショットやポスターなどとして一般的に見られるマルチパネル … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Muffin or Chihuahua? Challenging Multimodal Large Language Models with Multipanel VQA はコメントを受け付けていません

HuatuoGPT-Vision, Towards Injecting Medical Visual Knowledge into Multimodal LLMs at Scale

要約 GPT-4V などのマルチモーダル大規模言語モデル (MLLM) の急速な … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | HuatuoGPT-Vision, Towards Injecting Medical Visual Knowledge into Multimodal LLMs at Scale はコメントを受け付けていません

Efficient World Models with Context-Aware Tokenization

要約 深い強化学習 (RL) 手法をスケールアップするには、大きな課題が伴います … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Efficient World Models with Context-Aware Tokenization はコメントを受け付けていません

Physics-Guided Neural Networks for Intraventricular Vector Flow Mapping

要約 心室内ベクトル フロー マッピング (iVFM) は、心臓イメージングにお … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, eess.IV | Physics-Guided Neural Networks for Intraventricular Vector Flow Mapping はコメントを受け付けていません

SAM: Semi-Active Mechanism for Extensible Continuum Manipulator and Real-time Hysteresis Compensation Control Algorithm

要約 ケーブル駆動連続マニピュレーター (CDCM) は、自然な開口部を介して傷 … 続きを読む

カテゴリー: cs.AI, cs.RO | SAM: Semi-Active Mechanism for Extensible Continuum Manipulator and Real-time Hysteresis Compensation Control Algorithm はコメントを受け付けていません

Stable Diffusion Segmentation for Biomedical Images with Single-step Reverse Process

要約 拡散モデルは、さまざまな生成タスクにわたってその有効性を実証しています。 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | Stable Diffusion Segmentation for Biomedical Images with Single-step Reverse Process はコメントを受け付けていません

ET tu, CLIP? Addressing Common Object Errors for Unseen Environments

要約 ALFRED タスクでのモデルの一般化を強化するために、事前トレーニングさ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | ET tu, CLIP? Addressing Common Object Errors for Unseen Environments はコメントを受け付けていません

Human-centered In-building Embodied Delivery Benchmark

要約 最近、身体化された知能の概念が広く受け入れられ普及し、人々はこの分野での商 … 続きを読む

カテゴリー: cs.AI, cs.RO | Human-centered In-building Embodied Delivery Benchmark はコメントを受け付けていません

ODIN: A Single Model for 2D and 3D Segmentation

要約 ScanNet などの現代の 3D セグメンテーション ベンチマークの最先 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | ODIN: A Single Model for 2D and 3D Segmentation はコメントを受け付けていません