月別アーカイブ: 2024年5月

A Generalist Learner for Multifaceted Medical Image Interpretation

要約 現在の医療用人工知能システムは狭い用途に限定されていることが多く、臨床現場 … 続きを読む

カテゴリー: cs.CV | A Generalist Learner for Multifaceted Medical Image Interpretation はコメントを受け付けていません

Plot2Code: A Comprehensive Benchmark for Evaluating Multi-modal Large Language Models in Code Generation from Scientific Plots

要約 マルチモーダル大規模言語モデル (MLLM) の目覚ましい進歩は、視覚的な … 続きを読む

カテゴリー: cs.CL, cs.CV | Plot2Code: A Comprehensive Benchmark for Evaluating Multi-modal Large Language Models in Code Generation from Scientific Plots はコメントを受け付けていません

SPIN: Simultaneous Perception, Interaction and Navigation

要約 最近、操作と移動の分野では目覚ましい進歩が見られますが、モバイル操作は依然 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO, cs.SY, eess.SY | SPIN: Simultaneous Perception, Interaction and Navigation はコメントを受け付けていません

MambaOut: Do We Really Need Mamba for Vision?

要約 Mamba は、状態空間モデル (SSM) の RNN のようなトークン … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | MambaOut: Do We Really Need Mamba for Vision? はコメントを受け付けていません

Look Once to Hear: Target Speech Hearing with Noisy Examples

要約 混雑した環境では、人間の脳は、音声がどのように聞こえるかについて事前に知識 … 続きを読む

カテゴリー: cs.AI, cs.SD, eess.AS | Look Once to Hear: Target Speech Hearing with Noisy Examples はコメントを受け付けていません

MRSegmentator: Robust Multi-Modality Segmentation of 40 Classes in MRI and CT Sequences

要約 目的: MRI スキャンで多臓器セグメンテーションが可能な深層学習モデルを … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV, J.3 | MRSegmentator: Robust Multi-Modality Segmentation of 40 Classes in MRI and CT Sequences はコメントを受け付けていません

Single-seed generation of Brownian paths and integrals for adaptive and high order SDE solvers

要約 ODE シミュレーションにおける適応タイムステップの成功にもかかわらず、確 … 続きを読む

カテゴリー: cs.LG, cs.NA, math.NA, math.PR, stat.CO | Single-seed generation of Brownian paths and integrals for adaptive and high order SDE solvers はコメントを受け付けていません

LLM Discussion: Enhancing the Creativity of Large Language Models via Discussion Framework and Role-Play

要約 大規模言語モデル (LLM) は、自然言語処理において優れた能力を示してい … 続きを読む

カテゴリー: cs.AI, cs.CL | LLM Discussion: Enhancing the Creativity of Large Language Models via Discussion Framework and Role-Play はコメントを受け付けていません

ReefGlider: A highly maneuverable vectored buoyancy engine based underwater robot

要約 現在利用可能な自律型水中ビークル (AUV) の設計には能力のギャップが存 … 続きを読む

カテゴリー: cs.RO, cs.SY, eess.SY | ReefGlider: A highly maneuverable vectored buoyancy engine based underwater robot はコメントを受け付けていません

Bi-VLA: Vision-Language-Action Model-Based System for Bimanual Robotic Dexterous Manipulations

要約 この研究では、視覚、言語理解、身体動作をシームレスに統合する両手ロボットの … 続きを読む

カテゴリー: cs.RO | Bi-VLA: Vision-Language-Action Model-Based System for Bimanual Robotic Dexterous Manipulations はコメントを受け付けていません