月別アーカイブ: 2025年1月

Exploring AI-based System Design for Pixel-level Protected Health Information Detection in Medical Images

要約 医療画像の匿名化は、研究や臨床現場でデータを共有する際のプライバシーを確​ … 続きを読む

カテゴリー: cs.CV | Exploring AI-based System Design for Pixel-level Protected Health Information Detection in Medical Images はコメントを受け付けていません

Text-driven Adaptation of Foundation Models for Few-shot Surgical Workflow Analysis

要約 目的: 手術ワークフロー分析は、手術の効率と安全性を向上させるために非常に … 続きを読む

カテゴリー: cs.AI, cs.CV | Text-driven Adaptation of Foundation Models for Few-shot Surgical Workflow Analysis はコメントを受け付けていません

A New Teacher-Reviewer-Student Framework for Semi-supervised 2D Human Pose Estimation

要約 従来の 2D 人間の姿勢推定方法では通常、大規模なラベル付き注釈が必要であ … 続きを読む

カテゴリー: cs.CV | A New Teacher-Reviewer-Student Framework for Semi-supervised 2D Human Pose Estimation はコメントを受け付けていません

Latent Space Characterization of Autoencoder Variants

要約 深層学習モデルによって学習された潜在空間を理解することは、複雑なデータがど … 続きを読む

カテゴリー: cs.CV, cs.IT, cs.LG, math.IT | Latent Space Characterization of Autoencoder Variants はコメントを受け付けていません

Bayesian Low-Rank LeArning (Bella): A Practical Approach to Bayesian Neural Networks

要約 ベイジアン学習の計算の複雑さは、実際の大規模なタスクへのベイジアン学習の採 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Bayesian Low-Rank LeArning (Bella): A Practical Approach to Bayesian Neural Networks はコメントを受け付けていません

Sequential PatchCore: Anomaly Detection for Surface Inspection using Synthetic Impurities

要約 表面の不純物 (水の汚れ、指紋、ステッカーなど) の出現は、自動外観検査シ … 続きを読む

カテゴリー: 68U05, 68U10, cs.CV, cs.GR, cs.LG, I.2.1 | Sequential PatchCore: Anomaly Detection for Surface Inspection using Synthetic Impurities はコメントを受け付けていません

VITA-1.5: Towards GPT-4o Level Real-Time Vision and Speech Interaction

要約 最近のマルチモーダル大規模言語モデル (MLLM) は通常、視覚的モダリテ … 続きを読む

カテゴリー: cs.CV, cs.SD, eess.AS | VITA-1.5: Towards GPT-4o Level Real-Time Vision and Speech Interaction はコメントを受け付けていません

Mesh2SLAM in VR: A Fast Geometry-Based SLAM Framework for Rapid Prototyping in Virtual Reality Applications

要約 SLAM は、ロボット工学や AR/VR に幅広く応用できる基礎的な技術で … 続きを読む

カテゴリー: cs.CV, cs.RO | Mesh2SLAM in VR: A Fast Geometry-Based SLAM Framework for Rapid Prototyping in Virtual Reality Applications はコメントを受け付けていません

MECD+: Unlocking Event-Level Causal Graph Discovery for Video Reasoning

要約 ビデオ因果推論は、因果関係の観点からビデオを高度に理解することを目的として … 続きを読む

カテゴリー: cs.CV | MECD+: Unlocking Event-Level Causal Graph Discovery for Video Reasoning はコメントを受け付けていません

Metric Learning with Progressive Self-Distillation for Audio-Visual Embedding Learning

要約 メトリクス学習はサンプルを埋め込み空間に投影し、そこで学習された表現に基づ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.IR, cs.MM, cs.SD, eess.AS | Metric Learning with Progressive Self-Distillation for Audio-Visual Embedding Learning はコメントを受け付けていません