月別アーカイブ: 2024年2月

Synthesizing Forestry Images Conditioned on Plant Phenotype Using a Generative Adversarial Network

要約 リモートセンシングデータを使用した植物季節学および表現型予測は、農業生産性 … 続きを読む

カテゴリー: cs.CV | Synthesizing Forestry Images Conditioned on Plant Phenotype Using a Generative Adversarial Network はコメントを受け付けていません

Transferring facade labels between point clouds with semantic octrees while considering change detection

要約 点群と高解像度 3D データは、測量、建設、仮想現実などのさまざまな分野で … 続きを読む

カテゴリー: cs.CV, cs.LG | Transferring facade labels between point clouds with semantic octrees while considering change detection はコメントを受け付けていません

Feature Density Estimation for Out-of-Distribution Detection via Normalizing Flows

要約 配布外 (OOD) の検出は、オープンワールド設定で学習システムを安全に展 … 続きを読む

カテゴリー: cs.CV | Feature Density Estimation for Out-of-Distribution Detection via Normalizing Flows はコメントを受け付けていません

Hybridnet for depth estimation and semantic segmentation

要約 セマンティック セグメンテーションと深度推定は、画像処理の分野における 2 … 続きを読む

カテゴリー: cs.CV | Hybridnet for depth estimation and semantic segmentation はコメントを受け付けていません

Model Selection of Zero-shot Anomaly Detectors in the Absence of Labeled Validation Data

要約 異常検出には、ラベルのない大規模なデータセット内の異常なサンプルを検出する … 続きを読む

カテゴリー: cs.CV, cs.LG | Model Selection of Zero-shot Anomaly Detectors in the Absence of Labeled Validation Data はコメントを受け付けていません

Video Annotator: A framework for efficiently building video classifiers using vision-language models and active learning

要約 高品質で一貫性のあるアノテーションは、堅牢な機械学習モデルの開発を成功させ … 続きを読む

カテゴリー: cs.CV, cs.LG | Video Annotator: A framework for efficiently building video classifiers using vision-language models and active learning はコメントを受け付けていません

More than the Sum of Its Parts: Ensembling Backbone Networks for Few-Shot Segmentation

要約 セマンティック セグメンテーションは、\acrlong{ai} およびロボ … 続きを読む

カテゴリー: cs.CV, cs.LG | More than the Sum of Its Parts: Ensembling Backbone Networks for Few-Shot Segmentation はコメントを受け付けていません

MAIRA-1: A specialised large multimodal model for radiology report generation

要約 胸部 X 線 (CXR) から放射線医学レポートを生成するタスクのための放 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | MAIRA-1: A specialised large multimodal model for radiology report generation はコメントを受け付けていません

On the Out-Of-Distribution Generalization of Multimodal Large Language Models

要約 私たちは、配布外のシナリオとドメイン固有のタスクの下での包括的な評価を通じ … 続きを読む

カテゴリー: cs.AI, cs.CV | On the Out-Of-Distribution Generalization of Multimodal Large Language Models はコメントを受け付けていません

LLaVA-Phi: Efficient Multi-Modal Assistant with Small Language Model

要約 この論文では、最近進歩した小型言語モデルである Phi-2 の力を利用して … 続きを読む

カテゴリー: cs.CL, cs.CV | LLaVA-Phi: Efficient Multi-Modal Assistant with Small Language Model はコメントを受け付けていません