「cs.AI」カテゴリーアーカイブ

Human-Aware Vision-and-Language Navigation: Bridging Simulation to Reality with Dynamic Human Interactions

投稿日: 2024年6月28日作成者: jarxiv

要約 Vision-and-Language Navigation (VLN) … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

Muffin or Chihuahua? Challenging Multimodal Large Language Models with Multipanel VQA

投稿日: 2024年6月28日作成者: jarxiv

要約 Web スクリーンショットやポスターなどとして一般的に見られるマルチパネル … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

HuatuoGPT-Vision, Towards Injecting Medical Visual Knowledge into Multimodal LLMs at Scale

投稿日: 2024年6月28日作成者: jarxiv

要約 GPT-4V などのマルチモーダル大規模言語モデル (MLLM) の急速な … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Efficient World Models with Context-Aware Tokenization

投稿日: 2024年6月28日作成者: jarxiv

要約深い強化学習 (RL) 手法をスケールアップするには、大きな課題が伴います … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Physics-Guided Neural Networks for Intraventricular Vector Flow Mapping

投稿日: 2024年6月28日作成者: jarxiv

要約心室内ベクトルフローマッピング (iVFM) は、心臓イメージングにお … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, eess.IV | コメントを受け付けていません

SAM: Semi-Active Mechanism for Extensible Continuum Manipulator and Real-time Hysteresis Compensation Control Algorithm

投稿日: 2024年6月28日作成者: jarxiv

要約ケーブル駆動連続マニピュレーター (CDCM) は、自然な開口部を介して傷 … 続きを読む →

カテゴリー: cs.AI, cs.RO | コメントを受け付けていません

Stable Diffusion Segmentation for Biomedical Images with Single-step Reverse Process

投稿日: 2024年6月28日作成者: jarxiv

要約拡散モデルは、さまざまな生成タスクにわたってその有効性を実証しています。 … 続きを読む →

カテゴリー: cs.AI, cs.CV, eess.IV | コメントを受け付けていません

ET tu, CLIP? Addressing Common Object Errors for Unseen Environments

投稿日: 2024年6月27日作成者: jarxiv

要約 ALFRED タスクでのモデルの一般化を強化するために、事前トレーニングさ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Human-centered In-building Embodied Delivery Benchmark

投稿日: 2024年6月27日作成者: jarxiv

要約最近、身体化された知能の概念が広く受け入れられ普及し、人々はこの分野での商 … 続きを読む →

カテゴリー: cs.AI, cs.RO | コメントを受け付けていません

ODIN: A Single Model for 2D and 3D Segmentation

投稿日: 2024年6月27日作成者: jarxiv

要約 ScanNet などの現代の 3D セグメンテーションベンチマークの最先 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

Human-Aware Vision-and-Language Navigation: Bridging Simulation to Reality with Dynamic Human Interactions

Muffin or Chihuahua? Challenging Multimodal Large Language Models with Multipanel VQA

HuatuoGPT-Vision, Towards Injecting Medical Visual Knowledge into Multimodal LLMs at Scale

Efficient World Models with Context-Aware Tokenization

Physics-Guided Neural Networks for Intraventricular Vector Flow Mapping

SAM: Semi-Active Mechanism for Extensible Continuum Manipulator and Real-time Hysteresis Compensation Control Algorithm

Stable Diffusion Segmentation for Biomedical Images with Single-step Reverse Process

ET tu, CLIP? Addressing Common Object Errors for Unseen Environments

Human-centered In-building Embodied Delivery Benchmark

ODIN: A Single Model for 2D and 3D Segmentation

最近の投稿

最近のコメント

アーカイブ

カテゴリー