月別アーカイブ: 2025年2月

A Brief Analysis of the Iterative Next Boundary Detection Network for Tree Rings Delineation in Images of Pinus taeda

要約 本研究では、CVPR-2023においてGillertらによって提案されたI … 続きを読む

カテゴリー: cs.CV, q-bio.QM | A Brief Analysis of the Iterative Next Boundary Detection Network for Tree Rings Delineation in Images of Pinus taeda はコメントを受け付けていません

SelfFed: Self-Supervised Federated Learning for Data Heterogeneity and Label Scarcity in Medical Images

要約 連合学習パラダイムにおける自己教師付き学習は、ラベル付けされていない孤立し … 続きを読む

カテゴリー: cs.CV, cs.LG | SelfFed: Self-Supervised Federated Learning for Data Heterogeneity and Label Scarcity in Medical Images はコメントを受け付けていません

TUMTraffic-VideoQA: A Benchmark for Unified Spatio-Temporal Video Understanding in Traffic Scenes

要約 TUMTraffic-VideoQAは、複雑な道路交通シナリオにおける時空 … 続きを読む

カテゴリー: cs.CV | TUMTraffic-VideoQA: A Benchmark for Unified Spatio-Temporal Video Understanding in Traffic Scenes はコメントを受け付けていません

Personalization Toolkit: Training Free Personalization of Large Vision Language Models

要約 ラージビジョン言語モデル(LVLM)は、個々のユーザーのユニークなニーズや … 続きを読む

カテゴリー: cs.CV | Personalization Toolkit: Training Free Personalization of Large Vision Language Models はコメントを受け付けていません

IMDPrompter: Adapting SAM to Image Manipulation Detection by Cross-View Automated Prompt Learning

要約 SA-1Bの膨大な学習データを用いたセグメント何でもモデル(SAM)は、卓 … 続きを読む

カテゴリー: cs.CV | IMDPrompter: Adapting SAM to Image Manipulation Detection by Cross-View Automated Prompt Learning はコメントを受け付けていません

SAISA: Towards Multimodal Large Language Models with Both Training and Inference Efficiency

要約 マルチモーダル大規模言語モデル(MLLM)は主に2つのアーキテクチャに分類 … 続きを読む

カテゴリー: cs.CL, cs.CV | SAISA: Towards Multimodal Large Language Models with Both Training and Inference Efficiency はコメントを受け付けていません

Towards Consistent and Controllable Image Synthesis for Face Editing

要約 現在の顔編集手法は主にGANベースの手法に依存しているが、最近では画像再構 … 続きを読む

カテゴリー: cs.CV | Towards Consistent and Controllable Image Synthesis for Face Editing はコメントを受け付けていません

High-Fidelity Human Avatars from Laptop Webcams using Edge Compute

要約 フォトリアリスティックな人間アバターを生成する用途は数多くあるが、高忠実度 … 続きを読む

カテゴリー: cs.CV | High-Fidelity Human Avatars from Laptop Webcams using Edge Compute はコメントを受け付けていません

Mind the Gap: Evaluating Patch Embeddings from General-Purpose and Histopathology Foundation Models for Cell Segmentation and Classification

要約 最近の基礎モデルの進歩はコンピュータ・ビジョンに変革をもたらし、デジタル病 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, q-bio.QM | Mind the Gap: Evaluating Patch Embeddings from General-Purpose and Histopathology Foundation Models for Cell Segmentation and Classification はコメントを受け付けていません

Monocular Per-Object Distance Estimation with Masked Object Modeling

要約 物体ごとの距離推定は、安全性が極めて重要な監視や自律走行において重要である … 続きを読む

カテゴリー: cs.CV | Monocular Per-Object Distance Estimation with Masked Object Modeling はコメントを受け付けていません