月別アーカイブ: 2024年3月

Q&A Prompts: Discovering Rich Visual Clues through Mining Question-Answer Prompts for VQA requiring Diverse World Knowledge

要約 マルチモーダルな大規模言語モデルの画期的な進歩により、高度な推論能力と世界 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Q&A Prompts: Discovering Rich Visual Clues through Mining Question-Answer Prompts for VQA requiring Diverse World Knowledge はコメントを受け付けていません

SemSegDepth: A Combined Model for Semantic Segmentation and Depth Completion

要約 シーンの全体的な理解は、自律マシンのパフォーマンスにとって極めて重要です。 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | SemSegDepth: A Combined Model for Semantic Segmentation and Depth Completion はコメントを受け付けていません

Adversarial Infrared Geometry: Using Geometry to Perform Adversarial Attack against Infrared Pedestrian Detectors

要約 現在、赤外線イメージング技術は広く使用されており、赤外線物体検出技術が急速 … 続きを読む

カテゴリー: cs.CV | Adversarial Infrared Geometry: Using Geometry to Perform Adversarial Attack against Infrared Pedestrian Detectors はコメントを受け付けていません

AI-Dentify: Deep learning for proximal caries detection on bitewing x-ray — HUNT4 Oral Health Study

要約 背景: う蝕の診断には、患者の咬翼診断画像を手動で検査し、その後、潜在的な … 続きを読む

カテゴリー: cs.AI, cs.CV, I.2.1 | AI-Dentify: Deep learning for proximal caries detection on bitewing x-ray — HUNT4 Oral Health Study はコメントを受け付けていません

3D Object Visibility Prediction in Autonomous Driving

要約 ハードウェアおよびソフトウェア技術の急速な進歩に伴い、自動運転の研究は大幅 … 続きを読む

カテゴリー: cs.CV, cs.RO | 3D Object Visibility Prediction in Autonomous Driving はコメントを受け付けていません

MolNexTR: A Generalized Deep Learning Model for Molecular Image Recognition

要約 化学構造認識の分野では、分子画像をグラフ構造と SMILES 文字列に変換 … 続きを読む

カテゴリー: cs.AI, cs.CV | MolNexTR: A Generalized Deep Learning Model for Molecular Image Recognition はコメントを受け付けていません

Swin-UMamba: Mamba-based UNet with ImageNet-based pretraining

要約 医療画像を正確にセグメンテーションするには、局所的な特徴からグローバルな依 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Swin-UMamba: Mamba-based UNet with ImageNet-based pretraining はコメントを受け付けていません

RaTrack: Moving Object Detection and Tracking with 4D Radar Point Cloud

要約 モバイルの自律性は、動的な環境を正確に認識することに依存しています。 した … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | RaTrack: Moving Object Detection and Tracking with 4D Radar Point Cloud はコメントを受け付けていません

Causal Prototype-inspired Contrast Adaptation for Unsupervised Domain Adaptive Semantic Segmentation of High-resolution Remote Sensing Imagery

要約 高解像度リモート センシング画像 (HRSI) のセマンティック セグメン … 続きを読む

カテゴリー: cs.CV | Causal Prototype-inspired Contrast Adaptation for Unsupervised Domain Adaptive Semantic Segmentation of High-resolution Remote Sensing Imagery はコメントを受け付けていません

Multi-Grained Cross-modal Alignment for Learning Open-vocabulary Semantic Segmentation from Text Supervision

要約 最近、テキスト監視からオープンボキャブラリーのセマンティックセグメンテーシ … 続きを読む

カテゴリー: cs.CV | Multi-Grained Cross-modal Alignment for Learning Open-vocabulary Semantic Segmentation from Text Supervision はコメントを受け付けていません