68T45」カテゴリーアーカイブ

AUTHENTICATION: Identifying Rare Failure Modes in Autonomous Vehicle Perception Systems using Adversarially Guided Diffusion Models

要約 自律車両(AVS)は、人工知能(AI)に依存して、オブジェクトを正確に検出 … 続きを読む

カテゴリー: 68T05, 68T45, cs.AI, cs.CV, cs.LG, cs.RO, I.2.10 | AUTHENTICATION: Identifying Rare Failure Modes in Autonomous Vehicle Perception Systems using Adversarially Guided Diffusion Models はコメントを受け付けていません

Ask2Loc: Learning to Locate Instructional Visual Answers by Asking Questions

要約 指導ビデオ内に特定のセグメントを見つけることは、ガイド知識を習得するための … 続きを読む

カテゴリー: 68T20, 68T45, cs.AI, cs.CV, cs.HC | Ask2Loc: Learning to Locate Instructional Visual Answers by Asking Questions はコメントを受け付けていません

Ask2Loc: Learning to Locate Instructional Visual Answers by Asking Questions

要約 指導ビデオ内に特定のセグメントを見つけることは、ガイド知識を習得するための … 続きを読む

カテゴリー: 68T20, 68T45, cs.AI, cs.CV, cs.HC | Ask2Loc: Learning to Locate Instructional Visual Answers by Asking Questions はコメントを受け付けていません

Explicit and Implicit Representations in AI-based 3D Reconstruction for Radiology: A systematic literature review

要約 臨床診療と診断支援における高品質の医療イメージングの需要により、放射線イメ … 続きを読む

カテゴリー: 68T45, cs.AI, cs.CV, cs.GR, I.4.5 | Explicit and Implicit Representations in AI-based 3D Reconstruction for Radiology: A systematic literature review はコメントを受け付けていません

From Gaze to Insight: Bridging Human Visual Attention and Vision Language Model Explanation for Weakly-Supervised Medical Image Segmentation

要約 医療画像セグメンテーションは、トレーニング用のピクセルレベルの注釈のコスト … 続きを読む

カテゴリー: 68T45, cs.CV, I.2.10 | From Gaze to Insight: Bridging Human Visual Attention and Vision Language Model Explanation for Weakly-Supervised Medical Image Segmentation はコメントを受け付けていません

Intelligent Framework for Human-Robot Collaboration: Dynamic Ergonomics and Adaptive Decision-Making

要約 産業環境への共同ロボットの統合により、生産性が向上しましたが、オペレーター … 続きを読む

カテゴリー: 68T40, 68T45, 93C85, cs.CV, cs.HC, cs.LG, cs.RO, H.5.2 | Intelligent Framework for Human-Robot Collaboration: Dynamic Ergonomics and Adaptive Decision-Making はコメントを受け付けていません

Hodge Laplacians and Hodge Diffusion Maps

要約 Hodge Diffusion Mapsは、高次元データセットからトポロジ … 続きを読む

カテゴリー: 68P05, 68T10, 68T45, 68W25, cs.LG | Hodge Laplacians and Hodge Diffusion Maps はコメントを受け付けていません

SF2T: Self-supervised Fragment Finetuning of Video-LLMs for Fine-Grained Understanding

要約 ビデオベースの大規模な言語モデル(ビデオ-LLM)は、マルチモーダルLLM … 続きを読む

カテゴリー: 68T45, cs.AI, cs.CV, I.4.8 | SF2T: Self-supervised Fragment Finetuning of Video-LLMs for Fine-Grained Understanding はコメントを受け付けていません

BUFF: Bayesian Uncertainty Guided Diffusion Probabilistic Model for Single Image Super-Resolution

要約 超解像(SR)技術は、特に高解像度画像が不可欠でありながらハードウェアの制 … 続きを読む

カテゴリー: 68T45, cs.AI, cs.CV, I.2.10 | BUFF: Bayesian Uncertainty Guided Diffusion Probabilistic Model for Single Image Super-Resolution はコメントを受け付けていません

Vision-Language Models for Acute Tuberculosis Diagnosis: A Multimodal Approach Combining Imaging and Clinical Data

要約 背景:この研究では、自動化された急性結核(TB)スクリーニングのためのSi … 続きを読む

カテゴリー: 68T07, 68T45, 68U10, 92C50, 92C55, cs.AI, cs.CV, cs.LG, eess.IV | Vision-Language Models for Acute Tuberculosis Diagnosis: A Multimodal Approach Combining Imaging and Clinical Data はコメントを受け付けていません