cs.AI」カテゴリーアーカイブ

Visual Speech Recognition for Languages with Limited Labeled Data using Automatic Labels from Whisper

要約 この論文では、複数の言語、特にラベル付きデータの数が限られている低リソース … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.AS | Visual Speech Recognition for Languages with Limited Labeled Data using Automatic Labels from Whisper はコメントを受け付けていません

UPDP: A Unified Progressive Depth Pruner for CNN and Vision Transformer

要約 ネットワーク チャネルを削減する従来のチャネルごとの枝刈り手法では、深さご … 続きを読む

カテゴリー: cs.AI, cs.CV | UPDP: A Unified Progressive Depth Pruner for CNN and Vision Transformer はコメントを受け付けていません

Overview of Computer Vision Techniques in Robotized Wire Harness Assembly: Current State and Future Opportunities

要約 ワイヤー ハーネスは、現代の自動車の電子システムに不可欠なハードウェアです … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Overview of Computer Vision Techniques in Robotized Wire Harness Assembly: Current State and Future Opportunities はコメントを受け付けていません

DiffDub: Person-generic Visual Dubbing Using Inpainting Renderer with Diffusion Auto-encoder

要約 高品質で人物に合わせたビジュアル ダビングを生成することは依然として課題で … 続きを読む

カテゴリー: cs.AI, cs.CV | DiffDub: Person-generic Visual Dubbing Using Inpainting Renderer with Diffusion Auto-encoder はコメントを受け付けていません

Improving the Detection of Small Oriented Objects in Aerial Images

要約 大規模な航空画像内の小さなピクセル領域を表す小さな方向を向いた物体は、その … 続きを読む

カテゴリー: cs.AI, cs.CV | Improving the Detection of Small Oriented Objects in Aerial Images はコメントを受け付けていません

Frequency Masking for Universal Deepfake Detection

要約 私たちは普遍的なディープフェイク検出を研究しています。 私たちの目標は、さ … 続きを読む

カテゴリー: cs.AI, cs.CV | Frequency Masking for Universal Deepfake Detection はコメントを受け付けていません

PCB-Vision: A Multiscene RGB-Hyperspectral Benchmark Dataset of Printed Circuit Boards

要約 電子廃棄物 (E-waste) のリサイクルという重要なテーマに取り組むこ … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | PCB-Vision: A Multiscene RGB-Hyperspectral Benchmark Dataset of Printed Circuit Boards はコメントを受け付けていません

Multimodal Learning for detecting urban functional zones using remote sensing image and multi-semantic information

要約 都市関心地域 (AOI) は、境界が定義された統合された都市機能ゾーンを指 … 続きを読む

カテゴリー: 68T99, cs.AI, cs.CV, I.4.9 | Multimodal Learning for detecting urban functional zones using remote sensing image and multi-semantic information はコメントを受け付けていません

Dynamic Behaviour of Connectionist Speech Recognition with Strong Latency Constraints

要約 この論文では、強力な遅延制約を伴う音声音声認識におけるコネクショニスト手法 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.SD, eess.AS, I.2.7 | Dynamic Behaviour of Connectionist Speech Recognition with Strong Latency Constraints はコメントを受け付けていません

Decoupling Pixel Flipping and Occlusion Strategy for Consistent XAI Benchmarks

要約 特徴除去は、オクルージョンベースの説明 (Shapley 値) とその評価 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Decoupling Pixel Flipping and Occlusion Strategy for Consistent XAI Benchmarks はコメントを受け付けていません