-
最近の投稿
- Agent-Based Emulation for Deploying Robot Swarm Behaviors
- Automated Planning Domain Inference for Task and Motion Planning
- Tactile Displays Driven by Projected Light
- Caging in Time: A Framework for Robust Object Manipulation under Uncertainties and Limited Robot Perception
- Implicit Contact Diffuser: Sequential Contact Reasoning with Latent Point Cloud Diffusion
-
最近のコメント
表示できるコメントはありません。 cs.AI (28464) cs.CL (21516) cs.CR (2224) cs.CV (35088) cs.LG (33220) cs.RO (16420) cs.SY (2528) eess.IV (4274) eess.SY (2522) stat.ML (4457)
月別アーカイブ: 2024年5月
A Foundation Model for Brain Lesion Segmentation with Mixture of Modality Experts
要約 脳病変のセグメンテーションは、神経学の研究と診断において重要な役割を果たし … 続きを読む
PRISM: A Multi-Modal Generative Foundation Model for Slide-Level Histopathology
要約 計算病理学の基礎モデルは、精密医療のための新しい臨床意思決定支援システムと … 続きを読む
When LLMs step into the 3D World: A Survey and Meta-Analysis of 3D Tasks via Multi-modal Large Language Models
要約 大規模言語モデル (LLM) が進化するにつれて、3D 空間データ (3D … 続きを読む
Biasing & Debiasing based Approach Towards Fair Knowledge Transfer for Equitable Skin Analysis
要約 深層学習モデル、特に畳み込みニューラル ネットワーク (CNN) は、皮膚 … 続きを読む
カテゴリー: cs.CV
Biasing & Debiasing based Approach Towards Fair Knowledge Transfer for Equitable Skin Analysis はコメントを受け付けていません
Two-Phase Dynamics of Interactions Explains the Starting Point of a DNN Learning Over-Fitted Features
要約 この論文では、ディープ ニューラル ネットワーク (DNN) 学習相互作用 … 続きを読む
A Tale of Two Languages: Large-Vocabulary Continuous Sign Language Recognition from Spoken Language Supervision
要約 この研究では、私たちの目標は 2 つあります。大語彙連続手話認識 (CSL … 続きを読む
Faces that Speak: Jointly Synthesising Talking Face and Speech from Text
要約 この作業の目標は、自然な話し顔とテキストからの音声出力を同時に生成すること … 続きを読む
FFF: Fixing Flawed Foundations in contrastive pre-training results in very strong Vision-Language models
要約 ノイズとキャプションの品質は視覚言語対比事前トレーニングに影響を与える重要 … 続きを読む
Fine-Tuning Large Vision-Language Models as Decision-Making Agents via Reinforcement Learning
要約 特殊な視覚指示に従うデータに基づいて微調整された大規模なビジョン言語モデル … 続きを読む
Grounding DINO 1.5: Advance the ‘Edge’ of Open-Set Object Detection
要約 このペーパーでは、IDEA Research が開発した一連の高度なオープ … 続きを読む
カテゴリー: cs.CV
Grounding DINO 1.5: Advance the ‘Edge’ of Open-Set Object Detection はコメントを受け付けていません