月別アーカイブ: 2024年9月

Multi-Model Ensemble Approach for Accurate Bi-Atrial Segmentation in LGE-MRI of Atrial Fibrillation Patients

要約 心房細動(AF)は不整脈の最も一般的な形態であり、罹患率と死亡率の増加に関 … 続きを読む

カテゴリー: cs.CV, eess.IV | Multi-Model Ensemble Approach for Accurate Bi-Atrial Segmentation in LGE-MRI of Atrial Fibrillation Patients はコメントを受け付けていません

MM-CamObj: A Comprehensive Multimodal Dataset for Camouflaged Object Scenarios

要約 大規模ビジュアル言語モデル (LVLM) は、複数のアプリケーションで大き … 続きを読む

カテゴリー: cs.CV | MM-CamObj: A Comprehensive Multimodal Dataset for Camouflaged Object Scenarios はコメントを受け付けていません

From Pixels to Words: Leveraging Explainability in Face Recognition through Interactive Natural Language Processing

要約 顔認識 (FR) はディープラーニングの発展により大幅に進歩し、いくつかの … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.CY, cs.LG | From Pixels to Words: Leveraging Explainability in Face Recognition through Interactive Natural Language Processing はコメントを受け付けていません

Neuromorphic Drone Detection: an Event-RGB Multimodal Approach

要約 近年、ドローンの検出が急速に大きな関心を集めています。封じ込められた大きさ … 続きを読む

カテゴリー: cs.AI, cs.CV | Neuromorphic Drone Detection: an Event-RGB Multimodal Approach はコメントを受け付けていません

CloudTrack: Scalable UAV Tracking with Cloud Semantics

要約 現在、無人航空機 (UAV) は、捜索エリア内の情報を収集するために捜索救 … 続きを読む

カテゴリー: cs.CV, cs.RO | CloudTrack: Scalable UAV Tracking with Cloud Semantics はコメントを受け付けていません

Deep Multimodal Collaborative Learning for Polyp Re-Identification

要約 結腸鏡ポリープ再識別は、大規模なギャラリーからの同じポリープを、さまざまな … 続きを読む

カテゴリー: cs.CV | Deep Multimodal Collaborative Learning for Polyp Re-Identification はコメントを受け付けていません

VisioPhysioENet: Multimodal Engagement Detection using Visual and Physiological Signals

要約 この論文では、視覚的な合図と生理学的信号を活用して学習者の関与を検出する新 … 続きを読む

カテゴリー: cs.CV | VisioPhysioENet: Multimodal Engagement Detection using Visual and Physiological Signals はコメントを受け付けていません

HA-FGOVD: Highlighting Fine-grained Attributes via Explicit Linear Composition for Open-Vocabulary Object Detection

要約 オープン語彙オブジェクト検出 (OVD) モデルは、その広範なトレーニング … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | HA-FGOVD: Highlighting Fine-grained Attributes via Explicit Linear Composition for Open-Vocabulary Object Detection はコメントを受け付けていません

GGHead: Fast and Generalizable 3D Gaussian Heads

要約 大規模な 2D 画像コレクションから 3D 頭部事前分布を学習することは、 … 続きを読む

カテゴリー: cs.CV | GGHead: Fast and Generalizable 3D Gaussian Heads はコメントを受け付けていません

Seeing Faces in Things: A Model and Dataset for Pareidolia

要約 人間の視覚システムは、あらゆる形や大きさの顔を検出できるようにうまく調整さ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.HC, cs.IR, cs.LG | Seeing Faces in Things: A Model and Dataset for Pareidolia はコメントを受け付けていません