cs.CV」カテゴリーアーカイブ

Video RWKV:Video Action Recognition Based RWKV

要約 CNN やトランスフォーマーなどの既存のビデオ理解方法における高い計算コス … 続きを読む

カテゴリー: cs.CV, cs.LG | Video RWKV:Video Action Recognition Based RWKV はコメントを受け付けていません

Online-LoRA: Task-free Online Continual Learning via Low Rank Adaptation

要約 壊滅的な忘却は、オンライン継続学習 (OCL) において、特にタスク境界が … 続きを読む

カテゴリー: cs.CV, cs.LG | Online-LoRA: Task-free Online Continual Learning via Low Rank Adaptation はコメントを受け付けていません

Tell What You Hear From What You See — Video to Audio Generation Through Text

要約 ビジュアル シーンとオーディオ シーンのコンテンツは多面的であり、ビデオと … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.SD, eess.AS | Tell What You Hear From What You See — Video to Audio Generation Through Text はコメントを受け付けていません

Autoregressive Adaptive Hypergraph Transformer for Skeleton-based Activity Recognition

要約 グラフ畳み込みネットワーク (GCN) のみを使用してマルチスケールのコン … 続きを読む

カテゴリー: cs.CV | Autoregressive Adaptive Hypergraph Transformer for Skeleton-based Activity Recognition はコメントを受け付けていません

Visual-TCAV: Concept-based Attribution and Saliency Maps for Post-hoc Explainability in Image Classification

要約 畳み込みニューラル ネットワーク (CNN) は、近年、パフォーマンスが大 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Visual-TCAV: Concept-based Attribution and Saliency Maps for Post-hoc Explainability in Image Classification はコメントを受け付けていません

Image inpainting enhancement by replacing the original mask with a self-attended region from the input image

要約 画像修復は、ピクセル情報を再構築することで画像の欠落または破損した領域を復 … 続きを読む

カテゴリー: cs.CV, eess.IV | Image inpainting enhancement by replacing the original mask with a self-attended region from the input image はコメントを受け付けていません

Image2Text2Image: A Novel Framework for Label-Free Evaluation of Image-to-Text Generation with Text-to-Image Diffusion Models

要約 自動生成された画像説明の品質を評価することは、文法性、適用範囲、正確性、真 … 続きを読む

カテゴリー: cs.CL, cs.CV | Image2Text2Image: A Novel Framework for Label-Free Evaluation of Image-to-Text Generation with Text-to-Image Diffusion Models はコメントを受け付けていません

From CNN to ConvRNN: Adapting Visualization Techniques for Time-Series Anomaly Detection

要約 現在、ニューラル ネットワークはさまざまな問題を解決するために一般的に使用 … 続きを読む

カテゴリー: cs.CV | From CNN to ConvRNN: Adapting Visualization Techniques for Time-Series Anomaly Detection はコメントを受け付けていません

Scaling Laws for Task-Optimized Models of the Primate Visual Ventral Stream

要約 大規模な物体分類データセットでトレーニングされると、特定の人工ニューラル … 続きを読む

カテゴリー: cs.CV, cs.LG, q-bio.NC | Scaling Laws for Task-Optimized Models of the Primate Visual Ventral Stream はコメントを受け付けていません

STARS: Sensor-agnostic Transformer Architecture for Remote Sensing

要約 スペクトル基礎モデルの基礎として、センサーに依存しないスペクトル変換器を紹 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | STARS: Sensor-agnostic Transformer Architecture for Remote Sensing はコメントを受け付けていません