「cs.CV」カテゴリーアーカイブ

Satellite Sunroof: High-res Digital Surface Models and Roof Segmentation for Global Solar Mapping

投稿日: 2024年8月27日作成者: jarxiv

要約再生可能エネルギー、特に太陽光発電への移行は、気候変動を緩和する鍵となりま … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Implicit Concept Removal of Diffusion Models

投稿日: 2024年8月27日作成者: jarxiv

要約 Text-to-Image (T2I) 拡散モデルでは、透かしや安全でない … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

LoG-VMamba: Local-Global Vision Mamba for Medical Image Segmentation

投稿日: 2024年8月27日作成者: jarxiv

要約状態空間モデル (SSM) である Mamba は、最近、自然言語処理およ … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

CHARTOM: A Visual Theory-of-Mind Benchmark for Multimodal Large Language Models

投稿日: 2024年8月27日作成者: jarxiv

要約マルチモーダル大規模言語モデルの視覚理論的ベンチマークである CHARTO … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

Evaluating saliency scores in point clouds of natural environments by learning surface anomalies

投稿日: 2024年8月27日作成者: jarxiv

要約近年、自然環境を記録するために 3 次元点群がますます使用されています。 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Few-Shot 3D Volumetric Segmentation with Multi-Surrogate Fusion

投稿日: 2024年8月27日作成者: jarxiv

要約従来の 3D 医用画像セグメンテーション方法では通常、過学習を避けるために … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Social perception of faces in a vision-language model

投稿日: 2024年8月27日作成者: jarxiv

要約私たちは、広く使用されているオープンソースの視覚言語モデルである CLIP … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.CY, cs.LG | コメントを受け付けていません

Attend-Fusion: Efficient Audio-Visual Fusion for Video Classification

投稿日: 2024年8月27日作成者: jarxiv

要約既存の方法では大規模なモデルアーキテクチャが必要となり、高い計算量とリソ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Model Parallel Training and Transfer Learning for Convolutional Neural Networks by Domain Decomposition

投稿日: 2024年8月27日作成者: jarxiv

要約ディープ畳み込みニューラルネットワーク (CNN) は、幅広い画像処理ア … 続きを読む →

カテゴリー: 65N55, 68T07, 68W10, 68W15, cs.CV, cs.LG, cs.NA, math.NA | コメントを受け付けていません

Center Direction Network for Grasping Point Localization on Cloths

投稿日: 2024年8月27日作成者: jarxiv

要約物体の把握はロボット工学とコンピュータビジョンにおける基本的な課題であり、 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Satellite Sunroof: High-res Digital Surface Models and Roof Segmentation for Global Solar Mapping

Implicit Concept Removal of Diffusion Models

LoG-VMamba: Local-Global Vision Mamba for Medical Image Segmentation

CHARTOM: A Visual Theory-of-Mind Benchmark for Multimodal Large Language Models

Evaluating saliency scores in point clouds of natural environments by learning surface anomalies

Few-Shot 3D Volumetric Segmentation with Multi-Surrogate Fusion

Social perception of faces in a vision-language model

Attend-Fusion: Efficient Audio-Visual Fusion for Video Classification

Model Parallel Training and Transfer Learning for Convolutional Neural Networks by Domain Decomposition

Center Direction Network for Grasping Point Localization on Cloths

最近の投稿

最近のコメント

アーカイブ

カテゴリー