月別アーカイブ: 2023年3月

Multi-View Keypoints for Reliable 6D Object Pose Estimation

要約 6D オブジェクトの姿勢推定は、環境との効率的な相互作用を可能にするロボテ … 続きを読む

カテゴリー: cs.CV | Multi-View Keypoints for Reliable 6D Object Pose Estimation はコメントを受け付けていません

MaMMUT: A Simple Architecture for Joint Learning for MultiModal Tasks

要約 言語モデルの開発は、エンコーダー/デコーダーからデコーダーのみの設計に移行 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | MaMMUT: A Simple Architecture for Joint Learning for MultiModal Tasks はコメントを受け付けていません

Effects of Degradations on Deep Neural Network Architectures

要約 深層畳み込みニューラル ネットワーク (CNN) は、大規模な画像分類の最 … 続きを読む

カテゴリー: cs.CV, eess.IV | Effects of Degradations on Deep Neural Network Architectures はコメントを受け付けていません

Generalizable Denoising of Microscopy Images using Generative Adversarial Networks and Contrastive Learning

要約 顕微鏡画像はしばしば高レベルのノイズに悩まされ、さらなる分析と解釈を妨げる … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Generalizable Denoising of Microscopy Images using Generative Adversarial Networks and Contrastive Learning はコメントを受け付けていません

Editing Models with Task Arithmetic

要約 事前トレーニング済みモデルの動作を変更する (たとえば、ダウンストリーム … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | Editing Models with Task Arithmetic はコメントを受け付けていません

Robust Dancer: Long-term 3D Dance Synthesis Using Unpaired Data

要約 楽曲に基づいて自然に見えるダンスの動きを自動的に合成する方法は、ますます人 … 続きを読む

カテゴリー: cs.CV, cs.GR | Robust Dancer: Long-term 3D Dance Synthesis Using Unpaired Data はコメントを受け付けていません

Beyond Empirical Risk Minimization: Local Structure Preserving Regularization for Improving Adversarial Robustness

要約 ディープ ニューラル ネットワークは、人間が知覚できない摂動を伴う敵対的な … 続きを読む

カテゴリー: cs.CR, cs.CV, cs.LG | Beyond Empirical Risk Minimization: Local Structure Preserving Regularization for Improving Adversarial Robustness はコメントを受け付けていません

ALUM: Adversarial Data Uncertainty Modeling from Latent Model Uncertainty Compensation

要約 モデルが精度だけでなく、予測の確実性にも注意を払うことが重要です。 ノイズ … 続きを読む

カテゴリー: cs.CV, cs.LG | ALUM: Adversarial Data Uncertainty Modeling from Latent Model Uncertainty Compensation はコメントを受け付けていません

A Video-based End-to-end Pipeline for Non-nutritive Sucking Action Recognition and Segmentation in Young Infants

要約 市販のベビーモニターのビデオ映像を使用して、発達遅延の潜在的なバイオマーカ … 続きを読む

カテゴリー: cs.CV | A Video-based End-to-end Pipeline for Non-nutritive Sucking Action Recognition and Segmentation in Young Infants はコメントを受け付けていません

STEFANN: Scene Text Editor using Font Adaptive Neural Network

要約 キャプチャされたシーンのテキスト情報は、シーンの解釈と意思決定において重要 … 続きを読む

カテゴリー: cs.CV, cs.MM | STEFANN: Scene Text Editor using Font Adaptive Neural Network はコメントを受け付けていません