月別アーカイブ: 2025年2月

iVISPAR — An Interactive Visual-Spatial Reasoning Benchmark for VLMs

要約 Vision-Language Models (VLMs) are kno … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | iVISPAR — An Interactive Visual-Spatial Reasoning Benchmark for VLMs はコメントを受け付けていません

PSC: Posterior Sampling-Based Compression

要約 拡散モデルは、画像生成の景観を変換し、イメージ圧縮の顕著な可能性を示してい … 続きを読む

カテゴリー: cs.CV, eess.IV | PSC: Posterior Sampling-Based Compression はコメントを受け付けていません

Learnable Expansion of Graph Operators for Multi-Modal Feature Fusion

要約 コンピュータービジョンのタスクでは、機能は多様な表現、ドメイン(屋内や屋外 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Learnable Expansion of Graph Operators for Multi-Modal Feature Fusion はコメントを受け付けていません

GARAD-SLAM: 3D GAussian splatting for Real-time Anti Dynamic SLAM

要約 3Dガウススプラッティング(3DGS)ベースのSLAMシステムは、リアルタ … 続きを読む

カテゴリー: cs.CV, cs.RO | GARAD-SLAM: 3D GAussian splatting for Real-time Anti Dynamic SLAM はコメントを受け付けていません

A Unified Framework for Semi-Supervised Image Segmentation and Registration

要約 注釈付きデータと発表されていないデータの両方を活用する半教師の学習は、医療 … 続きを読む

カテゴリー: cs.CV | A Unified Framework for Semi-Supervised Image Segmentation and Registration はコメントを受け付けていません

Efficient Vision Language Model Fine-tuning for Text-based Person Anomaly Search

要約 このペーパーでは、テキストベースの人の異常検索(TPA)に関するWWW 2 … 続きを読む

カテゴリー: cs.CV, cs.MM | Efficient Vision Language Model Fine-tuning for Text-based Person Anomaly Search はコメントを受け付けていません

A Kolmogorov metric embedding for live cell microscopy signaling patterns

要約 5-d $(x、y、z、チャネル、時間)$ライブセル顕微鏡映画で、細胞シグ … 続きを読む

カテゴリー: cs.CV, cs.LG | A Kolmogorov metric embedding for live cell microscopy signaling patterns はコメントを受け付けていません

Long-tailed Medical Diagnosis with Relation-aware Representation Learning and Iterative Classifier Calibration

要約 最近、コンピューター支援診断により、有望なパフォーマンスが実証されており、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | Long-tailed Medical Diagnosis with Relation-aware Representation Learning and Iterative Classifier Calibration はコメントを受け付けていません

Learning Ordinality in Semantic Segmentation

要約 セマンティックセグメンテーションは、各画像ピクセルのセマンティックラベルを … 続きを読む

カテゴリー: cs.CV, cs.LG | Learning Ordinality in Semantic Segmentation はコメントを受け付けていません

ZISVFM: Zero-Shot Object Instance Segmentation in Indoor Robotic Environments with Vision Foundation Models

要約 構造化されていない環境で動作するサービスロボットは、機能を強化するために不 … 続きを読む

カテゴリー: cs.CV, cs.RO | ZISVFM: Zero-Shot Object Instance Segmentation in Indoor Robotic Environments with Vision Foundation Models はコメントを受け付けていません