月別アーカイブ: 2024年2月

LaneSegNet: Map Learning with Lane Segment Perception for Autonomous Driving

要約 地図は、自動運転システムの下流アプリケーションにとって重要な情報として、通 … 続きを読む

カテゴリー: cs.CV | LaneSegNet: Map Learning with Lane Segment Perception for Autonomous Driving はコメントを受け付けていません

MM-SAP: A Comprehensive Benchmark for Assessing Self-Awareness of Multimodal Large Language Models in Perception

要約 マルチモーダル大規模言語モデル (MLLM) の最近の進歩により、視覚的な … 続きを読む

カテゴリー: cs.CL, cs.CV | MM-SAP: A Comprehensive Benchmark for Assessing Self-Awareness of Multimodal Large Language Models in Perception はコメントを受け付けていません

On Distributed Larger-Than-Memory Subset Selection With Pairwise Submodular Functions

要約 多くの学習問題は、サブセットの選択、つまり重要な代表点のサブセットを特定す … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.DC, cs.LG, math.OC | On Distributed Larger-Than-Memory Subset Selection With Pairwise Submodular Functions はコメントを受け付けていません

Evaluating the Significance of Outdoor Advertising from Driver’s Perspective Using Computer Vision

要約 道路脇の看板などの屋外広告は、マーケティング キャンペーンにおいて重要な役 … 続きを読む

カテゴリー: cs.CV, I.4.9 | Evaluating the Significance of Outdoor Advertising from Driver’s Perspective Using Computer Vision はコメントを受け付けていません

Supersampling of Data from Structured-light Scanner with Deep Learning

要約 この論文は、構造化光技術を使用して 3D カメラから取得される深度マップの … 続きを読む

カテゴリー: cs.CV, I.4.9 | Supersampling of Data from Structured-light Scanner with Deep Learning はコメントを受け付けていません

Processing and Segmentation of Human Teeth from 2D Images using Weakly Supervised Learning

要約 歯のセグメンテーションは、正確な診断と治療計画を立てるための歯科画像解析に … 続きを読む

カテゴリー: cs.CV, I.4.9 | Processing and Segmentation of Human Teeth from 2D Images using Weakly Supervised Learning はコメントを受け付けていません

Knowledge Graphs Meet Multi-Modal Learning: A Comprehensive Survey

要約 ナレッジ グラフ (KG) は、さまざまな AI アプリケーションを進歩さ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.IR, cs.LG | Knowledge Graphs Meet Multi-Modal Learning: A Comprehensive Survey はコメントを受け付けていません

VOOM: Robust Visual Object Odometry and Mapping using Hierarchical Landmarks

要約 近年、オブジェクト指向同時ローカライゼーションおよびマッピング (SLAM … 続きを読む

カテゴリー: cs.CV, cs.RO | VOOM: Robust Visual Object Odometry and Mapping using Hierarchical Landmarks はコメントを受け付けていません

Enhancing Representation in Medical Vision-Language Foundation Models via Multi-Scale Information Extraction Techniques

要約 医療視覚言語基盤モデルの開発は、さまざまな臨床応用での有望な可能性があるた … 続きを読む

カテゴリー: cs.CV | Enhancing Representation in Medical Vision-Language Foundation Models via Multi-Scale Information Extraction Techniques はコメントを受け付けていません

DCVSMNet: Double Cost Volume Stereo Matching Network

要約 我々は、2 つの小さな上位 (グループごと) コスト ボリュームと下位 ( … 続きを読む

カテゴリー: cs.CV | DCVSMNet: Double Cost Volume Stereo Matching Network はコメントを受け付けていません