月別アーカイブ: 2024年8月

Modelling Visual Semantics via Image Captioning to extract Enhanced Multi-Level Cross-Modal Semantic Incongruity Representation with Attention for Multimodal Sarcasm Detection

要約 皮肉は皮肉の一種であり、文字通りの解釈と意図された意味合いの間に本質的な不 … 続きを読む

カテゴリー: cs.AI, cs.CV | Modelling Visual Semantics via Image Captioning to extract Enhanced Multi-Level Cross-Modal Semantic Incongruity Representation with Attention for Multimodal Sarcasm Detection はコメントを受け付けていません

Revisiting Class-Incremental Learning with Pre-Trained Models: Generalizability and Adaptivity are All You Need

要約 クラス増分学習 (CIL) は、古いクラスを忘れることなく、出現する新しい … 続きを読む

カテゴリー: cs.CV, cs.LG | Revisiting Class-Incremental Learning with Pre-Trained Models: Generalizability and Adaptivity are All You Need はコメントを受け付けていません

APARATE: Adaptive Adversarial Patch for CNN-based Monocular Depth Estimation for Autonomous Navigation

要約 最近、単眼深度推定 (MDE) のパフォーマンスが大幅に向上しました。これ … 続きを読む

カテゴリー: cs.CV, cs.RO | APARATE: Adaptive Adversarial Patch for CNN-based Monocular Depth Estimation for Autonomous Navigation はコメントを受け付けていません

SSAP: A Shape-Sensitive Adversarial Patch for Comprehensive Disruption of Monocular Depth Estimation in Autonomous Navigation Applications

要約 単眼深度推定 (MDE) は、主に畳み込みニューラル ネットワーク (CN … 続きを読む

カテゴリー: cs.CV, cs.RO | SSAP: A Shape-Sensitive Adversarial Patch for Comprehensive Disruption of Monocular Depth Estimation in Autonomous Navigation Applications はコメントを受け付けていません

LaMamba-Diff: Linear-Time High-Fidelity Diffusion Models Based on Local Attention and Mamba

要約 最近の Transformer ベースの拡散モデルは、顕著なパフォーマンス … 続きを読む

カテゴリー: cs.CV | LaMamba-Diff: Linear-Time High-Fidelity Diffusion Models Based on Local Attention and Mamba はコメントを受け付けていません

YOWOv3: An Efficient and Generalized Framework for Human Action Detection and Recognition

要約 この論文では、YOWOv3 と呼ばれる新しいフレームワークを提案します。こ … 続きを読む

カテゴリー: cs.CV | YOWOv3: An Efficient and Generalized Framework for Human Action Detection and Recognition はコメントを受け付けていません

Unsupervised Change Detection for Space Habitats Using 3D Point Clouds

要約 この研究では、将来の宇宙生息地での自律的なロボットによる世話を可能にする、 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Unsupervised Change Detection for Space Habitats Using 3D Point Clouds はコメントを受け付けていません

VidGen-1M: A Large-Scale Dataset for Text-to-video Generation

要約 ビデオとテキストのペアの品質は、基本的にテキストとビデオのモデルの上限を決 … 続きを読む

カテゴリー: cs.CV | VidGen-1M: A Large-Scale Dataset for Text-to-video Generation はコメントを受け付けていません

Interactive 3D Medical Image Segmentation with SAM 2

要約 インタラクティブ医用画像セグメンテーション (IMIS) は、医療専門家か … 続きを読む

カテゴリー: cs.CV | Interactive 3D Medical Image Segmentation with SAM 2 はコメントを受け付けていません

On Using Quasirandom Sequences in Machine Learning for Model Weight Initialization

要約 ニューラル ネットワークのトレーニングの有効性は、機械学習アプリケーション … 続きを読む

カテゴリー: cs.CV, cs.LG | On Using Quasirandom Sequences in Machine Learning for Model Weight Initialization はコメントを受け付けていません