月別アーカイブ: 2024年8月

DQ-DETR: DETR with Dynamic Query for Tiny Object Detection

要約 これまでの DETR のような手法は一般的な物体検出では成功してきたにもか … 続きを読む

カテゴリー: cs.CV | DQ-DETR: DETR with Dynamic Query for Tiny Object Detection はコメントを受け付けていません

On the Error Analysis of 3D Gaussian Splatting and an Optimal Projection Strategy

要約 3D ガウス スプラッティングは幅広い注目を集め、リアルタイム ニューラル … 続きを読む

カテゴリー: cs.CV, cs.GR | On the Error Analysis of 3D Gaussian Splatting and an Optimal Projection Strategy はコメントを受け付けていません

Uncovering Knowledge Gaps in Radiology Report Generation Models through Knowledge Graphs

要約 人工知能の最近の進歩により、放射線医学レポートの自動生成が大幅に改善されま … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Uncovering Knowledge Gaps in Radiology Report Generation Models through Knowledge Graphs はコメントを受け付けていません

Satellite Sunroof: High-res Digital Surface Models and Roof Segmentation for Global Solar Mapping

要約 再生可能エネルギー、特に太陽光発電への移行は、気候変動を緩和する鍵となりま … 続きを読む

カテゴリー: cs.CV | Satellite Sunroof: High-res Digital Surface Models and Roof Segmentation for Global Solar Mapping はコメントを受け付けていません

Implicit Concept Removal of Diffusion Models

要約 Text-to-Image (T2I) 拡散モデルでは、透かしや安全でない … 続きを読む

カテゴリー: cs.CV | Implicit Concept Removal of Diffusion Models はコメントを受け付けていません

LoG-VMamba: Local-Global Vision Mamba for Medical Image Segmentation

要約 状態空間モデル (SSM) である Mamba は、最近、自然言語処理およ … 続きを読む

カテゴリー: cs.CV, cs.LG | LoG-VMamba: Local-Global Vision Mamba for Medical Image Segmentation はコメントを受け付けていません

CHARTOM: A Visual Theory-of-Mind Benchmark for Multimodal Large Language Models

要約 マルチモーダル大規模言語モデルの視覚理論的ベンチマークである CHARTO … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | CHARTOM: A Visual Theory-of-Mind Benchmark for Multimodal Large Language Models はコメントを受け付けていません

Evaluating saliency scores in point clouds of natural environments by learning surface anomalies

要約 近年、自然環境を記録するために 3 次元点群がますます使用されています。 … 続きを読む

カテゴリー: cs.CV, cs.LG | Evaluating saliency scores in point clouds of natural environments by learning surface anomalies はコメントを受け付けていません

Few-Shot 3D Volumetric Segmentation with Multi-Surrogate Fusion

要約 従来の 3D 医用画像セグメンテーション方法では通常、過学習を避けるために … 続きを読む

カテゴリー: cs.CV | Few-Shot 3D Volumetric Segmentation with Multi-Surrogate Fusion はコメントを受け付けていません

Social perception of faces in a vision-language model

要約 私たちは、広く使用されているオープンソースの視覚言語モデルである CLIP … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.CY, cs.LG | Social perception of faces in a vision-language model はコメントを受け付けていません