月別アーカイブ: 2023年6月

WBCAtt: A White Blood Cell Dataset Annotated with Detailed Morphological Attributes

要約 顕微鏡レベルでの血液サンプルの検査は臨床診断において基本的な役割を果たし、 … 続きを読む

カテゴリー: cs.CV | WBCAtt: A White Blood Cell Dataset Annotated with Detailed Morphological Attributes はコメントを受け付けていません

Solving Sample-Level Out-of-Distribution Detection on 3D Medical Images

要約 深層学習 (DL) モデルは、データがトレーニング分布とは異なる分布から取 … 続きを読む

カテゴリー: cs.CV, eess.IV | Solving Sample-Level Out-of-Distribution Detection on 3D Medical Images はコメントを受け付けていません

A Survey on Multimodal Large Language Models

要約 マルチモーダル大規模言語モデル (MLLM) は、最近新たに注目を集めてい … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | A Survey on Multimodal Large Language Models はコメントを受け付けていません

FPGA Implementation of Convolutional Neural Network for Real-Time Handwriting Recognition

要約 機械学習 (ML) は、コンピューター サイエンスの分野で最近急成長してい … 続きを読む

カテゴリー: cs.AR, cs.CV, cs.LG, eess.IV | FPGA Implementation of Convolutional Neural Network for Real-Time Handwriting Recognition はコメントを受け付けていません

Enhancing Next Active Object-based Egocentric Action Anticipation with Guided Attention

要約 一人称ビデオにおける短期アクション予測 (STA) は、次のアクティブなオ … 続きを読む

カテゴリー: cs.CV | Enhancing Next Active Object-based Egocentric Action Anticipation with Guided Attention はコメントを受け付けていません

Estimating Residential Solar Potential Using Aerial Data

要約 Project Sunroof は、高品質の航空データを使用して住宅建物の … 続きを読む

カテゴリー: cs.CV, eess.IV | Estimating Residential Solar Potential Using Aerial Data はコメントを受け付けていません

The MI-Motion Dataset and Benchmark for 3D Multi-Person Motion Prediction

要約 3D 複数人の動作予測は、個人の行動と人々の間の相互作用のモデル化を伴う困 … 続きを読む

カテゴリー: cs.CV | The MI-Motion Dataset and Benchmark for 3D Multi-Person Motion Prediction はコメントを受け付けていません

Penalty Gradient Normalization for Generative Adversarial Networks

要約 この論文では、鋭い勾配空間によって引き起こされる敵対的生成ネットワーク ( … 続きを読む

カテゴリー: cs.CV, cs.LG | Penalty Gradient Normalization for Generative Adversarial Networks はコメントを受け付けていません

A Semi-Paired Approach For Label-to-Image Translation

要約 データ効率、つまり少数のラベル付きデータから一般化する能力は、依然として深 … 続きを読む

カテゴリー: cs.CV | A Semi-Paired Approach For Label-to-Image Translation はコメントを受け付けていません

Visually-Grounded Descriptions Improve Zero-Shot Image Classification

要約 CLIP のような言語視覚モデルは、ゼロショット画像分類 (ZSIC) な … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Visually-Grounded Descriptions Improve Zero-Shot Image Classification はコメントを受け付けていません