月別アーカイブ: 2025年2月

iVISPAR — An Interactive Visual-Spatial Reasoning Benchmark for VLMs

投稿日: 2025年2月6日作成者: jarxiv

要約 Vision-Language Models (VLMs) are kno … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

PSC: Posterior Sampling-Based Compression

投稿日: 2025年2月6日作成者: jarxiv

要約拡散モデルは、画像生成の景観を変換し、イメージ圧縮の顕著な可能性を示してい … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Learnable Expansion of Graph Operators for Multi-Modal Feature Fusion

投稿日: 2025年2月6日作成者: jarxiv

要約コンピュータービジョンのタスクでは、機能は多様な表現、ドメイン（屋内や屋外 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

GARAD-SLAM: 3D GAussian splatting for Real-time Anti Dynamic SLAM

投稿日: 2025年2月6日作成者: jarxiv

要約 3Dガウススプラッティング（3DGS）ベースのSLAMシステムは、リアルタ … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

A Unified Framework for Semi-Supervised Image Segmentation and Registration

投稿日: 2025年2月6日作成者: jarxiv

要約注釈付きデータと発表されていないデータの両方を活用する半教師の学習は、医療 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Efficient Vision Language Model Fine-tuning for Text-based Person Anomaly Search

投稿日: 2025年2月6日作成者: jarxiv

要約このペーパーでは、テキストベースの人の異常検索（TPA）に関するWWW 2 … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

A Kolmogorov metric embedding for live cell microscopy signaling patterns

投稿日: 2025年2月6日作成者: jarxiv

要約 5-d $（x、y、z、チャネル、時間）$ライブセル顕微鏡映画で、細胞シグ … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Long-tailed Medical Diagnosis with Relation-aware Representation Learning and Iterative Classifier Calibration

投稿日: 2025年2月6日作成者: jarxiv

要約最近、コンピューター支援診断により、有望なパフォーマンスが実証されており、 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | コメントを受け付けていません

Learning Ordinality in Semantic Segmentation

投稿日: 2025年2月6日作成者: jarxiv

要約セマンティックセグメンテーションは、各画像ピクセルのセマンティックラベルを … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

ZISVFM: Zero-Shot Object Instance Segmentation in Indoor Robotic Environments with Vision Foundation Models

投稿日: 2025年2月6日作成者: jarxiv

要約構造化されていない環境で動作するサービスロボットは、機能を強化するために不 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

月別アーカイブ: 2025年2月

iVISPAR — An Interactive Visual-Spatial Reasoning Benchmark for VLMs

PSC: Posterior Sampling-Based Compression

Learnable Expansion of Graph Operators for Multi-Modal Feature Fusion

GARAD-SLAM: 3D GAussian splatting for Real-time Anti Dynamic SLAM

A Unified Framework for Semi-Supervised Image Segmentation and Registration

Efficient Vision Language Model Fine-tuning for Text-based Person Anomaly Search

A Kolmogorov metric embedding for live cell microscopy signaling patterns

Long-tailed Medical Diagnosis with Relation-aware Representation Learning and Iterative Classifier Calibration

Learning Ordinality in Semantic Segmentation

ZISVFM: Zero-Shot Object Instance Segmentation in Indoor Robotic Environments with Vision Foundation Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー