「cs.AI」カテゴリーアーカイブ

SOAP: Enhancing Spatio-Temporal Relation and Motion Information Capturing for Few-Shot Action Recognition

投稿日: 2024年8月22日作成者: jarxiv

要約動作認識の高フレームレート (HFR) ビデオは、時空間関係と動作情報密度 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

CluMo: Cluster-based Modality Fusion Prompt for Continual Learning in Visual Question Answering

投稿日: 2024年8月22日作成者: jarxiv

要約大規模ビジョン言語モデル (VLM) は、さまざまなアプリケーションドメ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

JieHua Paintings Style Feature Extracting Model using Stable Diffusion with ControlNet

投稿日: 2024年8月22日作成者: jarxiv

要約この研究は、Jiehua の文体的特徴を抽出するための新しいアプローチ、つ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Open-Ended 3D Point Cloud Instance Segmentation

投稿日: 2024年8月22日作成者: jarxiv

要約 Open-Vocab 3D インスタンスセグメンテーション手法 (OV- … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

SBDet: A Symmetry-Breaking Object Detector via Relaxed Rotation-Equivariance

投稿日: 2024年8月22日作成者: jarxiv

要約 Group Equivariant Convolution (GConv) … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Exploiting Diffusion Prior for Out-of-Distribution Detection

投稿日: 2024年8月22日作成者: jarxiv

要約配布外 (OOD) の検出は、特にセキュリティが重要な領域において、堅牢な … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Timeline and Boundary Guided Diffusion Network for Video Shadow Detection

投稿日: 2024年8月22日作成者: jarxiv

要約ビデオシャドウ検出 (VSD) は、フレームシーケンスを使用してシャド … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

DreamFactory: Pioneering Multi-Scene Long Video Generation with a Multi-Agent Framework

投稿日: 2024年8月22日作成者: jarxiv

要約現在のビデオ生成モデルは、短くてリアルなクリップの作成には優れていますが、 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.SE, TsingHua University | コメントを受け付けていません

LBC: Language-Based-Classifier for Out-Of-Variable Generalization

投稿日: 2024年8月22日作成者: jarxiv

要約大規模言語モデル (LLM) は、応答生成などの自然言語処理タスクで大きな … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

V-RoAst: A New Dataset for Visual Road Assessment

投稿日: 2024年8月22日作成者: jarxiv

要約道路交通事故は毎年何百万人もの死者を出しており、特に低・中所得国（LMIC … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.ET | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

SOAP: Enhancing Spatio-Temporal Relation and Motion Information Capturing for Few-Shot Action Recognition

CluMo: Cluster-based Modality Fusion Prompt for Continual Learning in Visual Question Answering

JieHua Paintings Style Feature Extracting Model using Stable Diffusion with ControlNet

Open-Ended 3D Point Cloud Instance Segmentation

SBDet: A Symmetry-Breaking Object Detector via Relaxed Rotation-Equivariance

Exploiting Diffusion Prior for Out-of-Distribution Detection

Timeline and Boundary Guided Diffusion Network for Video Shadow Detection

DreamFactory: Pioneering Multi-Scene Long Video Generation with a Multi-Agent Framework

LBC: Language-Based-Classifier for Out-Of-Variable Generalization

V-RoAst: A New Dataset for Visual Road Assessment

最近の投稿

最近のコメント

アーカイブ

カテゴリー