投稿者「jarxiv」のアーカイブ

Enhancing Few-Shot Image Classification through Learnable Multi-Scale Embedding and Attention Mechanisms

要約 少数ショット分類のコンテキストでは、満足のいくパフォーマンスを維持しながら … 続きを読む

カテゴリー: cs.AI, cs.CV | Enhancing Few-Shot Image Classification through Learnable Multi-Scale Embedding and Attention Mechanisms はコメントを受け付けていません

STROOBnet Optimization via GPU-Accelerated Proximal Recurrence Strategies

要約 時空間ネットワークの観察機能は、複数のセクターにわたる正確なデータ収集と情 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.MA | STROOBnet Optimization via GPU-Accelerated Proximal Recurrence Strategies はコメントを受け付けていません

Exploring AI-based System Design for Pixel-level Protected Health Information Detection in Medical Images

要約 医療画像の匿名化は、研究や臨床現場でデータを共有する際のプライバシーを確​ … 続きを読む

カテゴリー: cs.CV | Exploring AI-based System Design for Pixel-level Protected Health Information Detection in Medical Images はコメントを受け付けていません

Text-driven Adaptation of Foundation Models for Few-shot Surgical Workflow Analysis

要約 目的: 手術ワークフロー分析は、手術の効率と安全性を向上させるために非常に … 続きを読む

カテゴリー: cs.AI, cs.CV | Text-driven Adaptation of Foundation Models for Few-shot Surgical Workflow Analysis はコメントを受け付けていません

A New Teacher-Reviewer-Student Framework for Semi-supervised 2D Human Pose Estimation

要約 従来の 2D 人間の姿勢推定方法では通常、大規模なラベル付き注釈が必要であ … 続きを読む

カテゴリー: cs.CV | A New Teacher-Reviewer-Student Framework for Semi-supervised 2D Human Pose Estimation はコメントを受け付けていません

Latent Space Characterization of Autoencoder Variants

要約 深層学習モデルによって学習された潜在空間を理解することは、複雑なデータがど … 続きを読む

カテゴリー: cs.CV, cs.IT, cs.LG, math.IT | Latent Space Characterization of Autoencoder Variants はコメントを受け付けていません

Bayesian Low-Rank LeArning (Bella): A Practical Approach to Bayesian Neural Networks

要約 ベイジアン学習の計算の複雑さは、実際の大規模なタスクへのベイジアン学習の採 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Bayesian Low-Rank LeArning (Bella): A Practical Approach to Bayesian Neural Networks はコメントを受け付けていません

Sequential PatchCore: Anomaly Detection for Surface Inspection using Synthetic Impurities

要約 表面の不純物 (水の汚れ、指紋、ステッカーなど) の出現は、自動外観検査シ … 続きを読む

カテゴリー: 68U05, 68U10, cs.CV, cs.GR, cs.LG, I.2.1 | Sequential PatchCore: Anomaly Detection for Surface Inspection using Synthetic Impurities はコメントを受け付けていません

VITA-1.5: Towards GPT-4o Level Real-Time Vision and Speech Interaction

要約 最近のマルチモーダル大規模言語モデル (MLLM) は通常、視覚的モダリテ … 続きを読む

カテゴリー: cs.CV, cs.SD, eess.AS | VITA-1.5: Towards GPT-4o Level Real-Time Vision and Speech Interaction はコメントを受け付けていません

Mesh2SLAM in VR: A Fast Geometry-Based SLAM Framework for Rapid Prototyping in Virtual Reality Applications

要約 SLAM は、ロボット工学や AR/VR に幅広く応用できる基礎的な技術で … 続きを読む

カテゴリー: cs.CV, cs.RO | Mesh2SLAM in VR: A Fast Geometry-Based SLAM Framework for Rapid Prototyping in Virtual Reality Applications はコメントを受け付けていません