月別アーカイブ: 2025年1月

A Survey on Quality Metrics for Text-to-Image Generation

要約 AIベースのテキストから画像へのモデルは、現実的な画像の生成に優れているだ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | A Survey on Quality Metrics for Text-to-Image Generation はコメントを受け付けていません

3DSES: an indoor Lidar point cloud segmentation dataset with real and pseudo-labels from a 3D model

要約 屋内ポイントクラウドのセマンティックセグメンテーションでは、ロボット工学、 … 続きを読む

カテゴリー: cs.CV | 3DSES: an indoor Lidar point cloud segmentation dataset with real and pseudo-labels from a 3D model はコメントを受け付けていません

Towards Training-Free Open-World Classification with 3D Generative Models

要約 3Dオープンワールド分類は、動的で構造化されていない現実世界のシナリオにお … 続きを読む

カテゴリー: cs.CV | Towards Training-Free Open-World Classification with 3D Generative Models はコメントを受け付けていません

Action Recognition Using Temporal Shift Module and Ensemble Learning

要約 このペーパーでは、\ ACL {ICPR} 2024のマルチモーダル視覚パ … 続きを読む

カテゴリー: cs.CV | Action Recognition Using Temporal Shift Module and Ensemble Learning はコメントを受け付けていません

An Exceptional Dataset For Rare Pancreatic Tumor Segmentation

要約 膵臓神経内分泌腫瘍(PNET)は、膵臓悪性腫瘍の5%未満を占める非常にまれ … 続きを読む

カテゴリー: cs.AI, cs.CV | An Exceptional Dataset For Rare Pancreatic Tumor Segmentation はコメントを受け付けていません

Transformer-Based Auxiliary Loss for Face Recognition Across Age Variations

要約 老化は、肌のテクスチャーとトーンの変化が時間の経過とともに顔の特徴を変える … 続きを読む

カテゴリー: cs.CV, I.5.2 | Transformer-Based Auxiliary Loss for Face Recognition Across Age Variations はコメントを受け付けていません

Trustworthy image-to-image translation: evaluating uncertainty calibration in unpaired training scenarios

要約 マンモグラフィスクリーニングは、乳がんを検出するための効果的な方法であり、 … 続きを読む

カテゴリー: cs.CV, eess.IV, physics.med-ph | Trustworthy image-to-image translation: evaluating uncertainty calibration in unpaired training scenarios はコメントを受け付けていません

Exposing Image Classifier Shortcuts with Counterfactual Frequency (CoF) Tables

要約 画像分類における深い学習の台頭は、前例のない精度をもたらしましたが、重要な … 続きを読む

カテゴリー: cs.AI, cs.CV | Exposing Image Classifier Shortcuts with Counterfactual Frequency (CoF) Tables はコメントを受け付けていません

Boosting Weak Positives for Text Based Person Search

要約 大規模なビジョン言語モデルは、クロスモーダルオブジェクトの検索に革命をもた … 続きを読む

カテゴリー: cs.CV, cs.LG | Boosting Weak Positives for Text Based Person Search はコメントを受け付けていません

A Robust Prototype-Based Network with Interpretable RBF Classifier Foundations

要約 プロトタイプベースの分類学習方法は、本質的に解釈可能であることが知られてい … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | A Robust Prototype-Based Network with Interpretable RBF Classifier Foundations はコメントを受け付けていません