月別アーカイブ: 2024年8月

Exploring Conditional Multi-Modal Prompts for Zero-shot HOI Detection

要約 ゼロショットのヒューマン オブジェクト インタラクション (HOI) 検出 … 続きを読む

カテゴリー: cs.CV | Exploring Conditional Multi-Modal Prompts for Zero-shot HOI Detection はコメントを受け付けていません

Annotation Cost-Efficient Active Learning for Deep Metric Learning Driven Remote Sensing Image Retrieval

要約 ディープメトリックラーニング (DML) は、リモートセンシング (RS) … 続きを読む

カテゴリー: cs.CV | Annotation Cost-Efficient Active Learning for Deep Metric Learning Driven Remote Sensing Image Retrieval はコメントを受け付けていません

HyperSpaceX: Radial and Angular Exploration of HyperSpherical Dimensions

要約 従来のディープ ラーニング モデルは、分類や顔認識などのタスクでソフトマッ … 続きを読む

カテゴリー: cs.CV | HyperSpaceX: Radial and Angular Exploration of HyperSpherical Dimensions はコメントを受け付けていません

Automatic rating of incomplete hippocampal inversions evaluated across multiple cohorts

要約 不完全海馬反転 (IHI) は、海馬回転異常とも呼ばれ、一般人口の約 20 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV, q-bio.NC | Automatic rating of incomplete hippocampal inversions evaluated across multiple cohorts はコメントを受け付けていません

Estimating Pore Location of PBF-LB/M Processes with Segmentation Models

要約 欠陥のない製品を確実に製造することは、レーザー粉末床融合プロセスにとって依 … 続きを読む

カテゴリー: cs.CV | Estimating Pore Location of PBF-LB/M Processes with Segmentation Models はコメントを受け付けていません

MeshAnything V2: Artist-Created Mesh Generation With Adjacent Mesh Tokenization

要約 与えられた形状に合わせて位置合わせされたアーティスト作成メッシュ (AM) … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | MeshAnything V2: Artist-Created Mesh Generation With Adjacent Mesh Tokenization はコメントを受け付けていません

HQOD: Harmonious Quantization for Object Detection

要約 タスクの不調和の問題は、最新の物体検出器でよく発生し、分類タスクと回帰タス … 続きを読む

カテゴリー: cs.CV | HQOD: Harmonious Quantization for Object Detection はコメントを受け付けていません

Vision Learners Meet Web Image-Text Pairs

要約 多くの自己教師あり学習手法は、厳選された ImageNet-1K データセ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Vision Learners Meet Web Image-Text Pairs はコメントを受け付けていません

Cross-Modality Clustering-based Self-Labeling for Multimodal Data Classification

要約 技術の進歩により、マルチモーダルなデータの取得が容易になり、認識システムに … 続きを読む

カテゴリー: cs.CV, cs.LG | Cross-Modality Clustering-based Self-Labeling for Multimodal Data Classification はコメントを受け付けていません

Contrastive Learning-based Multi Modal Architecture for Emoticon Prediction by Employing Image-Text Pairs

要約 絵文字は、一般にテキスト コンテンツに付随して、書かれたメッセージの真の意 … 続きを読む

カテゴリー: cs.AI, cs.CV | Contrastive Learning-based Multi Modal Architecture for Emoticon Prediction by Employing Image-Text Pairs はコメントを受け付けていません