68T45」カテゴリーアーカイブ

Does CLIP perceive art the same way we do?

要約 クリップは、関節の埋め込みを介して画像やテキストを接続できる強力なマルチモ … 続きを読む

カテゴリー: (Primary), 68T45, 68U10, cs.CV, cs.MM, I.2.10 | コメントする

Heart Failure Prediction using Modal Decomposition and Masked Autoencoders for Scarce Echocardiography Databases

要約 心臓病は、国際的な人間の障害の主な原因を構成します。 世界保健機関(WHO … 続きを読む

カテゴリー: 62H35, 68T07, 68T10, 68T45, cs.CV, eess.IV, I.2 | コメントする

Efficient Vision-based Vehicle Speed Estimation

要約 本稿では、交通カメラの映像から車速を推定するための計算効率の高い手法を紹介 … 続きを読む

カテゴリー: 68T45, cs.CV, I.4.9 | コメントする

Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models

要約 自律運転における共変量シフト問題に対処するために、潜在空間生成世界モデルの … 続きを読む

カテゴリー: (Primary), 68T45, cs.CV, cs.LG, cs.RO, cs.SY, eess.SY, I.2.10 | コメントする

AUTHENTICATION: Identifying Rare Failure Modes in Autonomous Vehicle Perception Systems using Adversarially Guided Diffusion Models

要約 自律車両(AVS)は、人工知能(AI)に依存して、オブジェクトを正確に検出 … 続きを読む

カテゴリー: 68T05, 68T45, cs.AI, cs.CV, cs.LG, cs.RO, I.2.10 | AUTHENTICATION: Identifying Rare Failure Modes in Autonomous Vehicle Perception Systems using Adversarially Guided Diffusion Models はコメントを受け付けていません

Ask2Loc: Learning to Locate Instructional Visual Answers by Asking Questions

要約 指導ビデオ内に特定のセグメントを見つけることは、ガイド知識を習得するための … 続きを読む

カテゴリー: 68T20, 68T45, cs.AI, cs.CV, cs.HC | Ask2Loc: Learning to Locate Instructional Visual Answers by Asking Questions はコメントを受け付けていません

Ask2Loc: Learning to Locate Instructional Visual Answers by Asking Questions

要約 指導ビデオ内に特定のセグメントを見つけることは、ガイド知識を習得するための … 続きを読む

カテゴリー: 68T20, 68T45, cs.AI, cs.CV, cs.HC | Ask2Loc: Learning to Locate Instructional Visual Answers by Asking Questions はコメントを受け付けていません

Explicit and Implicit Representations in AI-based 3D Reconstruction for Radiology: A systematic literature review

要約 臨床診療と診断支援における高品質の医療イメージングの需要により、放射線イメ … 続きを読む

カテゴリー: 68T45, cs.AI, cs.CV, cs.GR, I.4.5 | Explicit and Implicit Representations in AI-based 3D Reconstruction for Radiology: A systematic literature review はコメントを受け付けていません

From Gaze to Insight: Bridging Human Visual Attention and Vision Language Model Explanation for Weakly-Supervised Medical Image Segmentation

要約 医療画像セグメンテーションは、トレーニング用のピクセルレベルの注釈のコスト … 続きを読む

カテゴリー: 68T45, cs.CV, I.2.10 | From Gaze to Insight: Bridging Human Visual Attention and Vision Language Model Explanation for Weakly-Supervised Medical Image Segmentation はコメントを受け付けていません

Intelligent Framework for Human-Robot Collaboration: Dynamic Ergonomics and Adaptive Decision-Making

要約 産業環境への共同ロボットの統合により、生産性が向上しましたが、オペレーター … 続きを読む

カテゴリー: 68T40, 68T45, 93C85, cs.CV, cs.HC, cs.LG, cs.RO, H.5.2 | Intelligent Framework for Human-Robot Collaboration: Dynamic Ergonomics and Adaptive Decision-Making はコメントを受け付けていません