投稿者「jarxiv」のアーカイブ

CLIMB-3D: Continual Learning for Imbalanced 3D Instance Segmentation

投稿日: 2025年5月22日作成者: jarxiv

要約 3Dインスタンスセグメンテーション（3DIS）は大幅に進歩していますが、既 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Visual Perturbation and Adaptive Hard Negative Contrastive Learning for Compositional Reasoning in Vision-Language Models

投稿日: 2025年5月22日作成者: jarxiv

要約ビジョン言語モデル（VLM）は、マルチモーダルタスク、特に構成推論（CR） … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

UWSAM: Segment Anything Model Guided Underwater Instance Segmentation and A Large-scale Benchmark Dataset

投稿日: 2025年5月22日作成者: jarxiv

要約最近の大規模モデリングのブレークスルーにより、セグメントAnything … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Scaling Text-Rich Image Understanding via Code-Guided Synthetic Multimodal Data Generation

投稿日: 2025年5月22日作成者: jarxiv

要約チャートやドキュメントなどの豊富なテキストを持つ画像に関する推論は、ビジョ … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Diversity-Driven View Subset Selection for Indoor Novel View Synthesis

投稿日: 2025年5月22日作成者: jarxiv

要約屋内シーンの新しいビュー統合は、環境の単眼ビデオシーケンスをキャプチャする … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

VP Lab: a PEFT-Enabled Visual Prompting Laboratory for Semantic Segmentation

投稿日: 2025年5月22日作成者: jarxiv

要約大規模な前処理されたビジョンバックボーンは、セマンティックセグメンテーショ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Beyond Classification: Evaluating Diffusion Denoised Smoothing for Security-Utility Trade off

投稿日: 2025年5月22日作成者: jarxiv

要約基礎モデルは、さまざまなタスクで印象的なパフォーマンスを示していますが、敵 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

A Methodology to Evaluate Strategies Predicting Rankings on Unseen Domains

投稿日: 2025年5月22日作成者: jarxiv

要約多くの場合、複数のエンティティ（メソッド、アルゴリズム、手順、ソリューショ … 続きを読む →

カテゴリー: cs.CV, cs.PF | コメントを受け付けていません

Aggregation Schemes for Single-Vector WSI Representation Learning in Digital Pathology

投稿日: 2025年5月22日作成者: jarxiv

要約計算病理学で全体のスライド画像（WSI）を効率的に統合するための重要なステ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.IR, eess.IV, q-bio.QM | コメントを受け付けていません

LENS: Multi-level Evaluation of Multimodal Reasoning with Large Language Models

投稿日: 2025年5月22日作成者: jarxiv

要約マルチモーダル大手言語モデル（MLLM）は、視覚的および言語情報の統合に大 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

投稿者「jarxiv」のアーカイブ

CLIMB-3D: Continual Learning for Imbalanced 3D Instance Segmentation

Visual Perturbation and Adaptive Hard Negative Contrastive Learning for Compositional Reasoning in Vision-Language Models

UWSAM: Segment Anything Model Guided Underwater Instance Segmentation and A Large-scale Benchmark Dataset

Scaling Text-Rich Image Understanding via Code-Guided Synthetic Multimodal Data Generation

Diversity-Driven View Subset Selection for Indoor Novel View Synthesis

VP Lab: a PEFT-Enabled Visual Prompting Laboratory for Semantic Segmentation

Beyond Classification: Evaluating Diffusion Denoised Smoothing for Security-Utility Trade off

A Methodology to Evaluate Strategies Predicting Rankings on Unseen Domains

Aggregation Schemes for Single-Vector WSI Representation Learning in Digital Pathology

LENS: Multi-level Evaluation of Multimodal Reasoning with Large Language Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー