「cs.AI」カテゴリーアーカイブ

Visual Speech Recognition for Languages with Limited Labeled Data using Automatic Labels from Whisper

投稿日: 2024年1月15日作成者: jarxiv

要約この論文では、複数の言語、特にラベル付きデータの数が限られている低リソース … 続きを読む →

カテゴリー: cs.AI, cs.CV, eess.AS | コメントを受け付けていません

UPDP: A Unified Progressive Depth Pruner for CNN and Vision Transformer

投稿日: 2024年1月15日作成者: jarxiv

要約ネットワークチャネルを削減する従来のチャネルごとの枝刈り手法では、深さご … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Overview of Computer Vision Techniques in Robotized Wire Harness Assembly: Current State and Future Opportunities

投稿日: 2024年1月15日作成者: jarxiv

要約ワイヤーハーネスは、現代の自動車の電子システムに不可欠なハードウェアです … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

DiffDub: Person-generic Visual Dubbing Using Inpainting Renderer with Diffusion Auto-encoder

投稿日: 2024年1月15日作成者: jarxiv

要約高品質で人物に合わせたビジュアルダビングを生成することは依然として課題で … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Improving the Detection of Small Oriented Objects in Aerial Images

投稿日: 2024年1月15日作成者: jarxiv

要約大規模な航空画像内の小さなピクセル領域を表す小さな方向を向いた物体は、その … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Frequency Masking for Universal Deepfake Detection

投稿日: 2024年1月15日作成者: jarxiv

要約私たちは普遍的なディープフェイク検出を研究しています。私たちの目標は、さ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

PCB-Vision: A Multiscene RGB-Hyperspectral Benchmark Dataset of Printed Circuit Boards

投稿日: 2024年1月15日作成者: jarxiv

要約電子廃棄物 (E-waste) のリサイクルという重要なテーマに取り組むこ … 続きを読む →

カテゴリー: cs.AI, cs.CV, eess.IV | コメントを受け付けていません

Multimodal Learning for detecting urban functional zones using remote sensing image and multi-semantic information

投稿日: 2024年1月15日作成者: jarxiv

要約都市関心地域 (AOI) は、境界が定義された統合された都市機能ゾーンを指 … 続きを読む →

カテゴリー: 68T99, cs.AI, cs.CV, I.4.9 | コメントを受け付けていません

Dynamic Behaviour of Connectionist Speech Recognition with Strong Latency Constraints

投稿日: 2024年1月15日作成者: jarxiv

要約この論文では、強力な遅延制約を伴う音声音声認識におけるコネクショニスト手法 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.SD, eess.AS, I.2.7 | コメントを受け付けていません

Decoupling Pixel Flipping and Occlusion Strategy for Consistent XAI Benchmarks

投稿日: 2024年1月15日作成者: jarxiv

要約特徴除去は、オクルージョンベースの説明 (Shapley 値) とその評価 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

Visual Speech Recognition for Languages with Limited Labeled Data using Automatic Labels from Whisper

UPDP: A Unified Progressive Depth Pruner for CNN and Vision Transformer

Overview of Computer Vision Techniques in Robotized Wire Harness Assembly: Current State and Future Opportunities

DiffDub: Person-generic Visual Dubbing Using Inpainting Renderer with Diffusion Auto-encoder

Improving the Detection of Small Oriented Objects in Aerial Images

Frequency Masking for Universal Deepfake Detection

PCB-Vision: A Multiscene RGB-Hyperspectral Benchmark Dataset of Printed Circuit Boards

Multimodal Learning for detecting urban functional zones using remote sensing image and multi-semantic information

Dynamic Behaviour of Connectionist Speech Recognition with Strong Latency Constraints

Decoupling Pixel Flipping and Occlusion Strategy for Consistent XAI Benchmarks

最近の投稿

最近のコメント

アーカイブ

カテゴリー