月別アーカイブ: 2024年7月

Multi-label Cluster Discrimination for Visual Representation Learning

要約 対照言語画像事前トレーニング (CLIP) は、画像とテキストの対照学習に … 続きを読む

カテゴリー: cs.CV | Multi-label Cluster Discrimination for Visual Representation Learning はコメントを受け付けていません

Cascaded Light Propagation Volumes using Spherical Radial Basis Functions

要約 このペーパーでは、動的シーンで間接照明をシミュレートするための最新の方法の … 続きを読む

カテゴリー: cs.CV, cs.GR | Cascaded Light Propagation Volumes using Spherical Radial Basis Functions はコメントを受け付けていません

Preliminary study on artificial intelligence methods for cybersecurity threat detection in computer networks based on raw data packets

要約 コンピュータ ネットワークにおける侵入検出方法のほとんどは、トラフィック … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.CV, I.2.1 | Preliminary study on artificial intelligence methods for cybersecurity threat detection in computer networks based on raw data packets はコメントを受け付けていません

MM-Soc: Benchmarking Multimodal Large Language Models in Social Media Platforms

要約 ソーシャル メディア プラットフォームは、テキスト、画像、ビデオを含むマル … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.CY | MM-Soc: Benchmarking Multimodal Large Language Models in Social Media Platforms はコメントを受け付けていません

Deep Spherical Superpixels

要約 長年にわたり、スーパーピクセル セグメンテーションの使用はさまざまなアプリ … 続きを読む

カテゴリー: cs.CV | Deep Spherical Superpixels はコメントを受け付けていません

MuST: Multi-Scale Transformers for Surgical Phase Recognition

要約 手術ビデオにおける位相認識は、一連の手術段階の自動理解を可能にするため、コ … 続きを読む

カテゴリー: cs.AI, cs.CV | MuST: Multi-Scale Transformers for Surgical Phase Recognition はコメントを受け付けていません

ViPer: Visual Personalization of Generative Models via Individual Preference Learning

要約 異なるユーザーは、同じプロンプトに対して生成された異なる画像が望ましいと感 … 続きを読む

カテゴリー: cs.CV | ViPer: Visual Personalization of Generative Models via Individual Preference Learning はコメントを受け付けていません

PrevPredMap: Exploring Temporal Modeling with Previous Predictions for Online Vectorized HD Map Construction

要約 時間情報は、遮蔽されたインスタンスを検出するために重要です。 既存の時間表 … 続きを読む

カテゴリー: cs.CV | PrevPredMap: Exploring Temporal Modeling with Previous Predictions for Online Vectorized HD Map Construction はコメントを受け付けていません

MMRA: A Benchmark for Multi-granularity Multi-image Relational Association

要約 大規模視覚言語モデル (LVLM) が画像認識タスクで達成した目覚ましい成 … 続きを読む

カテゴリー: cs.CL, cs.CV | MMRA: A Benchmark for Multi-granularity Multi-image Relational Association はコメントを受け付けていません

MetaCap: Meta-learning Priors from Multi-View Imagery for Sparse-view Human Performance Capture and Rendering

要約 人間のパフォーマンスを忠実にキャプチャし、まばらな RGB 観察からフリー … 続きを読む

カテゴリー: cs.CV | MetaCap: Meta-learning Priors from Multi-View Imagery for Sparse-view Human Performance Capture and Rendering はコメントを受け付けていません