月別アーカイブ: 2024年8月

DQ-DETR: DETR with Dynamic Query for Tiny Object Detection

投稿日: 2024年8月27日作成者: jarxiv

要約これまでの DETR のような手法は一般的な物体検出では成功してきたにもか … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

On the Error Analysis of 3D Gaussian Splatting and an Optimal Projection Strategy

投稿日: 2024年8月27日作成者: jarxiv

要約 3D ガウススプラッティングは幅広い注目を集め、リアルタイムニューラル … 続きを読む →

カテゴリー: cs.CV, cs.GR | コメントを受け付けていません

Uncovering Knowledge Gaps in Radiology Report Generation Models through Knowledge Graphs

投稿日: 2024年8月27日作成者: jarxiv

要約人工知能の最近の進歩により、放射線医学レポートの自動生成が大幅に改善されま … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

Satellite Sunroof: High-res Digital Surface Models and Roof Segmentation for Global Solar Mapping

投稿日: 2024年8月27日作成者: jarxiv

要約再生可能エネルギー、特に太陽光発電への移行は、気候変動を緩和する鍵となりま … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Implicit Concept Removal of Diffusion Models

投稿日: 2024年8月27日作成者: jarxiv

要約 Text-to-Image (T2I) 拡散モデルでは、透かしや安全でない … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

LoG-VMamba: Local-Global Vision Mamba for Medical Image Segmentation

投稿日: 2024年8月27日作成者: jarxiv

要約状態空間モデル (SSM) である Mamba は、最近、自然言語処理およ … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

CHARTOM: A Visual Theory-of-Mind Benchmark for Multimodal Large Language Models

投稿日: 2024年8月27日作成者: jarxiv

要約マルチモーダル大規模言語モデルの視覚理論的ベンチマークである CHARTO … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

Evaluating saliency scores in point clouds of natural environments by learning surface anomalies

投稿日: 2024年8月27日作成者: jarxiv

要約近年、自然環境を記録するために 3 次元点群がますます使用されています。 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Few-Shot 3D Volumetric Segmentation with Multi-Surrogate Fusion

投稿日: 2024年8月27日作成者: jarxiv

要約従来の 3D 医用画像セグメンテーション方法では通常、過学習を避けるために … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Social perception of faces in a vision-language model

投稿日: 2024年8月27日作成者: jarxiv

要約私たちは、広く使用されているオープンソースの視覚言語モデルである CLIP … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.CY, cs.LG | コメントを受け付けていません

月別アーカイブ: 2024年8月

DQ-DETR: DETR with Dynamic Query for Tiny Object Detection

On the Error Analysis of 3D Gaussian Splatting and an Optimal Projection Strategy

Uncovering Knowledge Gaps in Radiology Report Generation Models through Knowledge Graphs

Satellite Sunroof: High-res Digital Surface Models and Roof Segmentation for Global Solar Mapping

Implicit Concept Removal of Diffusion Models

LoG-VMamba: Local-Global Vision Mamba for Medical Image Segmentation

CHARTOM: A Visual Theory-of-Mind Benchmark for Multimodal Large Language Models

Evaluating saliency scores in point clouds of natural environments by learning surface anomalies

Few-Shot 3D Volumetric Segmentation with Multi-Surrogate Fusion

Social perception of faces in a vision-language model

最近の投稿

最近のコメント

アーカイブ

カテゴリー