cs.CV」カテゴリーアーカイブ

Transformers and Large Language Models for Efficient Intrusion Detection Systems: A Comprehensive Survey

要約 Transformers LLM の大幅な進歩により、NLP はテキスト生 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.CV, eess.AS | Transformers and Large Language Models for Efficient Intrusion Detection Systems: A Comprehensive Survey はコメントを受け付けていません

InternVideo2: Scaling Foundation Models for Multimodal Video Understanding

要約 ビデオ認識、ビデオ テキスト タスク、およびビデオ中心の対話において最先端 … 続きを読む

カテゴリー: cs.CV | InternVideo2: Scaling Foundation Models for Multimodal Video Understanding はコメントを受け付けていません

DeepFace-Attention: Multimodal Face Biometrics for Attention Estimation with Application to e-Learning

要約 この研究では、ウェブカメラのビデオに適用された一連の顔分析技術を使用して、 … 続きを読む

カテゴリー: cs.CV, cs.HC | DeepFace-Attention: Multimodal Face Biometrics for Attention Estimation with Application to e-Learning はコメントを受け付けていません

Progressive Radiance Distillation for Inverse Rendering with Gaussian Splatting

要約 我々は、蒸留進行マップを使用して物理ベースのレンダリングとガウスベースの放 … 続きを読む

カテゴリー: cs.CV | Progressive Radiance Distillation for Inverse Rendering with Gaussian Splatting はコメントを受け付けていません

Disentangle and denoise: Tackling context misalignment for video moment retrieval

要約 ビデオモーメント検索は、自然言語クエリに従ってコンテキスト内のビデオモーメ … 続きを読む

カテゴリー: cs.CV | Disentangle and denoise: Tackling context misalignment for video moment retrieval はコメントを受け付けていません

Panacea+: Panoramic and Controllable Video Generation for Autonomous Driving

要約 自動運転の分野では、高品質の注釈付きビデオ トレーニング データの需要がま … 続きを読む

カテゴリー: cs.CV | Panacea+: Panoramic and Controllable Video Generation for Autonomous Driving はコメントを受け付けていません

CLIP with Generative Latent Replay: a Strong Baseline for Incremental Learning

要約 トランスフォーマーや CLIP などのビジョン言語モデル (VLM) の出 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | CLIP with Generative Latent Replay: a Strong Baseline for Incremental Learning はコメントを受け付けていません

Rethinking the Key Factors for the Generalization of Remote Sensing Stereo Matching Networks

要約 3D 再構成の重要なステップであるステレオ マッチングは、リモート センシ … 続きを読む

カテゴリー: cs.CV | Rethinking the Key Factors for the Generalization of Remote Sensing Stereo Matching Networks はコメントを受け付けていません

Compact Model Training by Low-Rank Projection with Energy Transfer

要約 低順位は従来の機械学習では重要な役割を果たしますが、深層学習ではあまり一般 … 続きを読む

カテゴリー: cs.CV | Compact Model Training by Low-Rank Projection with Energy Transfer はコメントを受け付けていません

Evolving from Single-modal to Multi-modal Facial Deepfake Detection: A Survey

要約 この調査は、人工知能の急速な進歩の中でディープフェイク検出という重大な課題 … 続きを読む

カテゴリー: cs.CV | Evolving from Single-modal to Multi-modal Facial Deepfake Detection: A Survey はコメントを受け付けていません