cs.CV」カテゴリーアーカイブ

Satellite Sunroof: High-res Digital Surface Models and Roof Segmentation for Global Solar Mapping

要約 再生可能エネルギー、特に太陽光発電への移行は、気候変動を緩和する鍵となりま … 続きを読む

カテゴリー: cs.CV | Satellite Sunroof: High-res Digital Surface Models and Roof Segmentation for Global Solar Mapping はコメントを受け付けていません

Implicit Concept Removal of Diffusion Models

要約 Text-to-Image (T2I) 拡散モデルでは、透かしや安全でない … 続きを読む

カテゴリー: cs.CV | Implicit Concept Removal of Diffusion Models はコメントを受け付けていません

LoG-VMamba: Local-Global Vision Mamba for Medical Image Segmentation

要約 状態空間モデル (SSM) である Mamba は、最近、自然言語処理およ … 続きを読む

カテゴリー: cs.CV, cs.LG | LoG-VMamba: Local-Global Vision Mamba for Medical Image Segmentation はコメントを受け付けていません

CHARTOM: A Visual Theory-of-Mind Benchmark for Multimodal Large Language Models

要約 マルチモーダル大規模言語モデルの視覚理論的ベンチマークである CHARTO … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | CHARTOM: A Visual Theory-of-Mind Benchmark for Multimodal Large Language Models はコメントを受け付けていません

Evaluating saliency scores in point clouds of natural environments by learning surface anomalies

要約 近年、自然環境を記録するために 3 次元点群がますます使用されています。 … 続きを読む

カテゴリー: cs.CV, cs.LG | Evaluating saliency scores in point clouds of natural environments by learning surface anomalies はコメントを受け付けていません

Few-Shot 3D Volumetric Segmentation with Multi-Surrogate Fusion

要約 従来の 3D 医用画像セグメンテーション方法では通常、過学習を避けるために … 続きを読む

カテゴリー: cs.CV | Few-Shot 3D Volumetric Segmentation with Multi-Surrogate Fusion はコメントを受け付けていません

Social perception of faces in a vision-language model

要約 私たちは、広く使用されているオープンソースの視覚言語モデルである CLIP … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.CY, cs.LG | Social perception of faces in a vision-language model はコメントを受け付けていません

Attend-Fusion: Efficient Audio-Visual Fusion for Video Classification

要約 既存の方法では大規模なモデル アーキテクチャが必要となり、高い計算量とリソ … 続きを読む

カテゴリー: cs.AI, cs.CV | Attend-Fusion: Efficient Audio-Visual Fusion for Video Classification はコメントを受け付けていません

Model Parallel Training and Transfer Learning for Convolutional Neural Networks by Domain Decomposition

要約 ディープ畳み込みニューラル ネットワーク (CNN) は、幅広い画像処理ア … 続きを読む

カテゴリー: 65N55, 68T07, 68W10, 68W15, cs.CV, cs.LG, cs.NA, math.NA | Model Parallel Training and Transfer Learning for Convolutional Neural Networks by Domain Decomposition はコメントを受け付けていません

Center Direction Network for Grasping Point Localization on Cloths

要約 物体の把握はロボット工学とコンピュータビジョンにおける基本的な課題であり、 … 続きを読む

カテゴリー: cs.CV | Center Direction Network for Grasping Point Localization on Cloths はコメントを受け付けていません