月別アーカイブ: 2025年6月

Pseudo-labelling meets Label Smoothing for Noisy Partial Label Learning

要約 完全に注釈されたデータセットをキュレートすることが高価であり、きめの分類な … 続きを読む

カテゴリー: cs.CV, cs.LG | コメントする

PuzzleWorld: A Benchmark for Multimodal, Open-Ended Reasoning in Puzzlehunts

要約 Puzzlehuntsは、明確に定義された問題の定義を欠いている複雑でマル … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | コメントする

STSBench: A Spatio-temporal Scenario Benchmark for Multi-modal Large Language Models in Autonomous Driving

要約 自律運転のためのビジョン言語モデル(VLMS)の全体的な理解をベンチマーク … 続きを読む

カテゴリー: cs.CV | コメントする

GenIR: Generative Visual Feedback for Mental Image Retrieval

要約 Vision-Language Models(VLMS)は、テキストから画 … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

Fréchet Radiomic Distance (FRD): A Versatile Metric for Comparing Medical Imaging Datasets

要約 2つの画像セットが同じまたは異なる分布またはドメインに属するかどうかを判断 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV, stat.ML | コメントする

A novel non-convex minimax $p$-th order concave penalty function approach to low-rank tensor completion

要約 低ランクのテンソル完了(LRTC)問題は、部分的なサンプル情報からテンソル … 続きを読む

カテゴリー: cs.CV | コメントする

Towards an Explainable Comparison and Alignment of Feature Embeddings

要約 文献ではいくつかの特徴埋め込みモデルが開発されていますが、これらの埋め込み … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, math.SP | コメントする

Challenging Vision-Language Models with Surgical Data: A New Dataset and Broad Benchmarking Study

要約 従来のコンピュータービジョンモデルは歴史的に内視鏡ドメインに一般化するのに … 続きを読む

カテゴリー: cs.CV | コメントする

Optimizing Cloud-to-GPU Throughput for Deep Learning With Earth Observation Data

要約 ペタバイトスケールの地球観測(EO)データに関するディープラーニングモデル … 続きを読む

カテゴリー: cs.CV | コメントする

A Lightweight Dual-Branch System for Weakly-Supervised Video Anomaly Detection on Consumer Edge Devices

要約 スマートホームカメラや個人監視システムなど、家電のインテリジェントなセキュ … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする