月別アーカイブ: 2023年1月

Joint Answering and Explanation for Visual Commonsense Reasoning

要約 Visual Commonsense Reasoning (VCR) は、 … 続きを読む

カテゴリー: cs.CV | Joint Answering and Explanation for Visual Commonsense Reasoning はコメントを受け付けていません

Sim2real Transfer Learning for Point Cloud Segmentation: An Industrial Application Case on Autonomous Disassembly

要約 ロボット工学のコンピューター ビジョン タスクでは、ディープ ラーニング … 続きを読む

カテゴリー: cs.CV | Sim2real Transfer Learning for Point Cloud Segmentation: An Industrial Application Case on Autonomous Disassembly はコメントを受け付けていません

RaftMLP: How Much Can Be Done Without Attention and with Less Spatial Locality?

要約 過去 10 年間、CNN はコンピューター ビジョンの世界で君臨してきまし … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | RaftMLP: How Much Can Be Done Without Attention and with Less Spatial Locality? はコメントを受け付けていません

Sequencer: Deep LSTM for Image Classification

要約 最近のコンピューター ビジョンの研究では、ビジョン トランスフォーマー ( … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Sequencer: Deep LSTM for Image Classification はコメントを受け付けていません

Multimodal Personality Recognition using Cross-Attention Transformer and Behaviour Encoding

要約 パーソナリティ コンピューティングと感情的コンピューティングは、多くの研究 … 続きを読む

カテゴリー: 68T05, 68T10, cs.AI, cs.CV, I.5 | Multimodal Personality Recognition using Cross-Attention Transformer and Behaviour Encoding はコメントを受け付けていません

Toward Building General Foundation Models for Language, Vision, and Vision-Language Understanding Tasks

要約 基礎モデルまたは事前トレーニング済みモデルは、さまざまな言語、視覚、および … 続きを読む

カテゴリー: cs.AI, cs.CV | Toward Building General Foundation Models for Language, Vision, and Vision-Language Understanding Tasks はコメントを受け付けていません

Wildfire Smoke Detection with Computer Vision

要約 山火事はますます頻繁になり、その影響は日々壊滅的になっています。 気候変動 … 続きを読む

カテゴリー: cs.AI, cs.CV | Wildfire Smoke Detection with Computer Vision はコメントを受け付けていません

The state-of-the-art 3D anisotropic intracranial hemorrhage segmentation on non-contrast head CT: The INSTANCE challenge

要約 3D 非造影頭部 CT (NCCT) スキャンにおける自動頭蓋内出血セグメ … 続きを読む

カテゴリー: cs.CV, eess.IV | The state-of-the-art 3D anisotropic intracranial hemorrhage segmentation on non-contrast head CT: The INSTANCE challenge はコメントを受け付けていません

Speech Driven Video Editing via an Audio-Conditioned Diffusion Model

要約 この論文では、ノイズ除去拡散モデルを使用した、エンドツーエンドの音声駆動ビ … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.SD, eess.AS | Speech Driven Video Editing via an Audio-Conditioned Diffusion Model はコメントを受け付けていません

Growing Cosine Unit: A Novel Oscillatory Activation Function That Can Speedup Training and Reduce Parameters in Convolutional Neural Networks

要約 畳み込みニューラル ネットワークは、社会的にも経済的にも重要な多くの問題の … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.NE, I.5 | Growing Cosine Unit: A Novel Oscillatory Activation Function That Can Speedup Training and Reduce Parameters in Convolutional Neural Networks はコメントを受け付けていません