-
最近の投稿
- Versatile Demonstration Interface: Toward More Flexible Robot Demonstration Collection
- Design Space Exploration of Embedded SoC Architectures for Real-Time Optimal Control
- SoftSnap: Rapid Prototyping of Untethered Soft Robots Using Snap-Together Modules
- Sparse Diffusion Policy: A Sparse, Reusable, and Flexible Policy for Robot Learning
- ODTFormer: Efficient Obstacle Detection and Tracking with Stereo Cameras Based on Transformer
-
最近のコメント
表示できるコメントはありません。 cs.AI (28672) cs.CL (21670) cs.CR (2234) cs.CV (35265) cs.LG (33441) cs.RO (16570) cs.SY (2550) eess.IV (4299) eess.SY (2544) stat.ML (4481)
月別アーカイブ: 2024年5月
A Generalist Learner for Multifaceted Medical Image Interpretation
要約 現在の医療用人工知能システムは狭い用途に限定されていることが多く、臨床現場 … 続きを読む
カテゴリー: cs.CV
A Generalist Learner for Multifaceted Medical Image Interpretation はコメントを受け付けていません
Plot2Code: A Comprehensive Benchmark for Evaluating Multi-modal Large Language Models in Code Generation from Scientific Plots
要約 マルチモーダル大規模言語モデル (MLLM) の目覚ましい進歩は、視覚的な … 続きを読む
SPIN: Simultaneous Perception, Interaction and Navigation
要約 最近、操作と移動の分野では目覚ましい進歩が見られますが、モバイル操作は依然 … 続きを読む
MambaOut: Do We Really Need Mamba for Vision?
要約 Mamba は、状態空間モデル (SSM) の RNN のようなトークン … 続きを読む
Look Once to Hear: Target Speech Hearing with Noisy Examples
要約 混雑した環境では、人間の脳は、音声がどのように聞こえるかについて事前に知識 … 続きを読む
MRSegmentator: Robust Multi-Modality Segmentation of 40 Classes in MRI and CT Sequences
要約 目的: MRI スキャンで多臓器セグメンテーションが可能な深層学習モデルを … 続きを読む
Single-seed generation of Brownian paths and integrals for adaptive and high order SDE solvers
要約 ODE シミュレーションにおける適応タイムステップの成功にもかかわらず、確 … 続きを読む
LLM Discussion: Enhancing the Creativity of Large Language Models via Discussion Framework and Role-Play
要約 大規模言語モデル (LLM) は、自然言語処理において優れた能力を示してい … 続きを読む
ReefGlider: A highly maneuverable vectored buoyancy engine based underwater robot
要約 現在利用可能な自律型水中ビークル (AUV) の設計には能力のギャップが存 … 続きを読む
Bi-VLA: Vision-Language-Action Model-Based System for Bimanual Robotic Dexterous Manipulations
要約 この研究では、視覚、言語理解、身体動作をシームレスに統合する両手ロボットの … 続きを読む
カテゴリー: cs.RO
Bi-VLA: Vision-Language-Action Model-Based System for Bimanual Robotic Dexterous Manipulations はコメントを受け付けていません