月別アーカイブ: 2024年5月

A Generalist Learner for Multifaceted Medical Image Interpretation

投稿日: 2024年5月14日作成者: jarxiv

要約現在の医療用人工知能システムは狭い用途に限定されていることが多く、臨床現場 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Plot2Code: A Comprehensive Benchmark for Evaluating Multi-modal Large Language Models in Code Generation from Scientific Plots

投稿日: 2024年5月14日作成者: jarxiv

要約マルチモーダル大規模言語モデル (MLLM) の目覚ましい進歩は、視覚的な … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

SPIN: Simultaneous Perception, Interaction and Navigation

投稿日: 2024年5月14日作成者: jarxiv

要約最近、操作と移動の分野では目覚ましい進歩が見られますが、モバイル操作は依然 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO, cs.SY, eess.SY | コメントを受け付けていません

MambaOut: Do We Really Need Mamba for Vision?

投稿日: 2024年5月14日作成者: jarxiv

要約 Mamba は、状態空間モデル (SSM) の RNN のようなトークン … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Look Once to Hear: Target Speech Hearing with Noisy Examples

投稿日: 2024年5月14日作成者: jarxiv

要約混雑した環境では、人間の脳は、音声がどのように聞こえるかについて事前に知識 … 続きを読む →

カテゴリー: cs.AI, cs.SD, eess.AS | コメントを受け付けていません

MRSegmentator: Robust Multi-Modality Segmentation of 40 Classes in MRI and CT Sequences

投稿日: 2024年5月14日作成者: jarxiv

要約目的: MRI スキャンで多臓器セグメンテーションが可能な深層学習モデルを … 続きを読む →

カテゴリー: cs.CV, cs.LG, eess.IV, J.3 | コメントを受け付けていません

Single-seed generation of Brownian paths and integrals for adaptive and high order SDE solvers

投稿日: 2024年5月14日作成者: jarxiv

要約 ODE シミュレーションにおける適応タイムステップの成功にもかかわらず、確 … 続きを読む →

カテゴリー: cs.LG, cs.NA, math.NA, math.PR, stat.CO | コメントを受け付けていません

LLM Discussion: Enhancing the Creativity of Large Language Models via Discussion Framework and Role-Play

投稿日: 2024年5月14日作成者: jarxiv

要約大規模言語モデル (LLM) は、自然言語処理において優れた能力を示してい … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

ReefGlider: A highly maneuverable vectored buoyancy engine based underwater robot

投稿日: 2024年5月13日作成者: jarxiv

要約現在利用可能な自律型水中ビークル (AUV) の設計には能力のギャップが存 … 続きを読む →

カテゴリー: cs.RO, cs.SY, eess.SY | コメントを受け付けていません

Bi-VLA: Vision-Language-Action Model-Based System for Bimanual Robotic Dexterous Manipulations

投稿日: 2024年5月13日作成者: jarxiv

要約この研究では、視覚、言語理解、身体動作をシームレスに統合する両手ロボットの … 続きを読む →

カテゴリー: cs.RO | コメントを受け付けていません

月別アーカイブ: 2024年5月

A Generalist Learner for Multifaceted Medical Image Interpretation

Plot2Code: A Comprehensive Benchmark for Evaluating Multi-modal Large Language Models in Code Generation from Scientific Plots

SPIN: Simultaneous Perception, Interaction and Navigation

MambaOut: Do We Really Need Mamba for Vision?

Look Once to Hear: Target Speech Hearing with Noisy Examples

MRSegmentator: Robust Multi-Modality Segmentation of 40 Classes in MRI and CT Sequences

Single-seed generation of Brownian paths and integrals for adaptive and high order SDE solvers

LLM Discussion: Enhancing the Creativity of Large Language Models via Discussion Framework and Role-Play

ReefGlider: A highly maneuverable vectored buoyancy engine based underwater robot

Bi-VLA: Vision-Language-Action Model-Based System for Bimanual Robotic Dexterous Manipulations

最近の投稿

最近のコメント

アーカイブ

カテゴリー