月別アーカイブ: 2025年2月

TEMSET-24K: Densely Annotated Dataset for Indexing Multipart Endoscopic Videos using Surgical Timeline Segmentation

要約 内視鏡外科ビデオのインデックス作成は、外科的データサイエンスでは不可欠であ … 続きを読む

カテゴリー: cs.CV | TEMSET-24K: Densely Annotated Dataset for Indexing Multipart Endoscopic Videos using Surgical Timeline Segmentation はコメントを受け付けていません

Learning Musical Representations for Music Performance Question Answering

要約 音楽パフォーマンスは、視聴覚モデリングの代表的なシナリオです。 まばらなオ … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | Learning Musical Representations for Music Performance Question Answering はコメントを受け付けていません

A Lightweight Attention-based Deep Network via Multi-Scale Feature Fusion for Multi-View Facial Expression Recognition

要約 畳み込みニューラルネットワーク(CNNS)とその変動により、表情表現認識( … 続きを読む

カテゴリー: cs.CV | A Lightweight Attention-based Deep Network via Multi-Scale Feature Fusion for Multi-View Facial Expression Recognition はコメントを受け付けていません

Señorita-2M: A High-Quality Instruction-based Dataset for General Video Editing by Video Specialists

要約 ビデオ生成の最近の進歩により、ビデオ編集技術の開発が促進されました。これは … 続きを読む

カテゴリー: cs.CV | Señorita-2M: A High-Quality Instruction-based Dataset for General Video Editing by Video Specialists はコメントを受け付けていません

Enhancing Pneumonia Diagnosis and Severity Assessment through Deep Learning: A Comprehensive Approach Integrating CNN Classification and Infection Segmentation

要約 肺疾患は、肺炎が一般的な懸念事項であり、実質的な世界的な健康課題をもたらし … 続きを読む

カテゴリー: cs.CV | Enhancing Pneumonia Diagnosis and Severity Assessment through Deep Learning: A Comprehensive Approach Integrating CNN Classification and Infection Segmentation はコメントを受け付けていません

CleanUMamba: A Compact Mamba Network for Speech Denoising using Channel Pruning

要約 このペーパーでは、生の波形に直接適用されるリアルタイムの因果オーディオ除去 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.SD, eess.AS | CleanUMamba: A Compact Mamba Network for Speech Denoising using Channel Pruning はコメントを受け付けていません

ViSIR: Vision Transformer Single Image Reconstruction Method for Earth System Models

要約 目的:地球システムモデル(ESM)大気、海、陸地、氷、生物圏の相互作用を統 … 続きを読む

カテゴリー: cs.CV | ViSIR: Vision Transformer Single Image Reconstruction Method for Earth System Models はコメントを受け付けていません

DPD-NeuralEngine: A 22-nm 6.6-TOPS/W/mm$^2$ Recurrent Neural Network Accelerator for Wideband Power Amplifier Digital Pre-Distortion

要約 最新の通信システムにおけるDeep Neural Network(DNN) … 続きを読む

カテゴリー: cs.AI, cs.AR, cs.CV | DPD-NeuralEngine: A 22-nm 6.6-TOPS/W/mm$^2$ Recurrent Neural Network Accelerator for Wideband Power Amplifier Digital Pre-Distortion はコメントを受け付けていません

Wandering around: A bioinspired approach to visual attention through object motion sensitivity

要約 アクティブビジョンは、動的な視覚的知覚を可能にし、大規模なデータセットと高 … 続きを読む

カテゴリー: cs.CV | Wandering around: A bioinspired approach to visual attention through object motion sensitivity はコメントを受け付けていません

Accelerating Data Processing and Benchmarking of AI Models for Pathology

要約 基礎モデリングの進歩により、計算病理学が再形成されました。 ただし、利用可 … 続きを読む

カテゴリー: cs.CV | Accelerating Data Processing and Benchmarking of AI Models for Pathology はコメントを受け付けていません