-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Hallucination Benchmark in Medical Visual Question Answering
要約 視覚質問応答 (VQA) に関する大規模な言語および視覚モデルの最近の成功 … 続きを読む
HiCAST: Highly Customized Arbitrary Style Transfer with Adapter Enhanced Diffusion Models
要約 Arbitrary Style Transfer (AST) の目標は、ス … 続きを読む
Machine Learning Applications in Traumatic Brain Injury: A Spotlight on Mild TBI
要約 外傷性脳損傷(TBI)は、世界的な公衆衛生上の重大な課題を引き起こしており … 続きを読む
CoSSegGaussians: Compact and Swift Scene Segmenting 3D Gaussians
要約 我々は、RGB画像のみを入力して、高速なレンダリング速度でコンパクトな3D … 続きを読む
Heterogeneous Generative Knowledge Distillation with Masked Image Modeling
要約 通常、小規模な CNN ベースのモデルは、計算リソースが制限されたエッジ … 続きを読む
An attempt to generate new bridge types from latent space of PixelCNN
要約 生成人工知能テクノロジーを使用して、新しい種類の橋を生成してみます。 Py … 続きを読む
How does the primate brain combine generative and discriminative computations in vision?
要約 ビジョンは推論問題として広く理解されています。 しかし、推論プロセスの 2 … 続きを読む
Surgical-DINO: Adapter Learning of Foundation Model for Depth Estimation in Endoscopic Surgery
要約 目的: ロボット手術における深さの推定は、3D 再構成、手術ナビゲーション … 続きを読む
Linear Spaces of Meanings: Compositional Structures in Vision-Language Models
要約 私たちは、事前にトレーニングされたビジョン言語モデル (VLM) からデー … 続きを読む
Manipulating Feature Visualizations with Gradient Slingshots
要約 ディープ ニューラル ネットワーク (DNN) は、複雑で多彩な表現を学習 … 続きを読む