I.2.10」カテゴリーアーカイブ

Beyond Few-shot Object Detection: A Detailed Survey

要約 物体検出は、画像やビデオ内の特定の物体を正確に識別して位置を特定することに … 続きを読む

カテゴリー: cs.AI, cs.CV, I.2.10 | Beyond Few-shot Object Detection: A Detailed Survey はコメントを受け付けていません

VALE: A Multimodal Visual and Language Explanation Framework for Image Classifiers using eXplainable AI and Language Models

要約 ディープ ニューラル ネットワーク (DNN) は、タスクの自動化を可能に … 続きを読む

カテゴリー: (Primary), 68U10, cs.AI, cs.CL, cs.CV, cs.LG, I.2.10 | VALE: A Multimodal Visual and Language Explanation Framework for Image Classifiers using eXplainable AI and Language Models はコメントを受け付けていません

Modeling the Neonatal Brain Development Using Implicit Neural Representations

要約 人間の脳は妊娠後期に急速に発達します。 この研究では、この年齢層の新生児の … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV, I.2.10 | Modeling the Neonatal Brain Development Using Implicit Neural Representations はコメントを受け付けていません

Toward a Dialogue System Using a Large Language Model to Recognize User Emotions with a Camera

要約 ChatGPT\copyright{} やその他の LLM のパフォーマン … 続きを読む

カテゴリー: 68T40, cs.AI, cs.HC, cs.RO, I.2.10 | Toward a Dialogue System Using a Large Language Model to Recognize User Emotions with a Camera はコメントを受け付けていません

A Distributed Privacy Preserving Model for the Detection of Alzheimer’s Disease

要約 背景: 医療データのセグメント化、個人健康情報 (PHI) 侵害に関する懸 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.DC, cs.LG, I.2.10 | A Distributed Privacy Preserving Model for the Detection of Alzheimer’s Disease はコメントを受け付けていません

A Spitting Image: Modular Superpixel Tokenization in Vision Transformers

要約 Vision Transformer (ViT) アーキテクチャは伝統的に … 続きを読む

カテゴリー: 68T45, cs.AI, cs.CV, cs.LG, I.2.10 | A Spitting Image: Modular Superpixel Tokenization in Vision Transformers はコメントを受け付けていません

Data Science for Geographic Information Systems

要約 データ サイエンスを地理情報システム (GIS) に統合することで、これら … 続きを読む

カテゴリー: cs.CV, eess.IV, I.2.10, physics.geo-ph | Data Science for Geographic Information Systems はコメントを受け付けていません

A Spitting Image: Modular Superpixel Tokenization in Vision Transformers

要約 Vision Transformer (ViT) アーキテクチャは伝統的に … 続きを読む

カテゴリー: 68T45, cs.AI, cs.CV, cs.LG, I.2.10 | A Spitting Image: Modular Superpixel Tokenization in Vision Transformers はコメントを受け付けていません

SpectralGaussians: Semantic, spectral 3D Gaussian splatting for multi-spectral scene representation, visualization and analysis

要約 我々は、登録されたマルチビュー スペクトルとセグメンテーション マップから … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, I.2.10 | SpectralGaussians: Semantic, spectral 3D Gaussian splatting for multi-spectral scene representation, visualization and analysis はコメントを受け付けていません

IN-Sight: Interactive Navigation through Sight

要約 現在のビジュアル ナビゲーション システムは、環境を静的なものとして扱うこ … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO, I.2.10 | IN-Sight: Interactive Navigation through Sight はコメントを受け付けていません