投稿者「jarxiv」のアーカイブ

Learning Real Facial Concepts for Independent Deepfake Detection

要約 DeepFake検出モデルは、目標ドメインの偽物として実際のインスタンスを … 続きを読む

カテゴリー: cs.CV | Learning Real Facial Concepts for Independent Deepfake Detection はコメントを受け付けていません

Question-Answering Dense Video Events

要約 このペーパーでは、密集したビデオイベントに関する質問を提示します。これは、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | Question-Answering Dense Video Events はコメントを受け付けていません

Ming-Lite-Uni: Advancements in Unified Architecture for Natural Multimodal Interaction

要約 Ming-Lite-Uniは、新しく設計された統一された視覚ジェネレーター … 続きを読む

カテゴリー: cs.CV | Ming-Lite-Uni: Advancements in Unified Architecture for Natural Multimodal Interaction はコメントを受け付けていません

CAD-Llama: Leveraging Large Language Models for Computer-Aided Design Parametric 3D Model Generation

要約 最近、大規模な言語モデル(LLM)が大幅に成功し、一般的なテキストを超えて … 続きを読む

カテゴリー: cs.CV | CAD-Llama: Leveraging Large Language Models for Computer-Aided Design Parametric 3D Model Generation はコメントを受け付けていません

Bayesian computation with generative diffusion models by Multilevel Monte Carlo

要約 生成的拡散モデルは最近、ベイジアンの逆問題で確率的サンプリングを実行する強 … 続きを読む

カテゴリー: cs.CV, cs.LG, stat.CO | Bayesian computation with generative diffusion models by Multilevel Monte Carlo はコメントを受け付けていません

FA-KPConv: Introducing Euclidean Symmetries to KPConv via Frame Averaging

要約 3Dポイントクラウド分析のために広く採用されているバックボーンである、よく … 続きを読む

カテゴリー: cs.CV | FA-KPConv: Introducing Euclidean Symmetries to KPConv via Frame Averaging はコメントを受け付けていません

Efficient Flow Matching using Latent Variables

要約 フローマッチングモデルは、確率的生成モデルの間で画像生成タスクに大きな可能 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Efficient Flow Matching using Latent Variables はコメントを受け付けていません

‘I Can See Forever!’: Evaluating Real-time VideoLLMs for Assisting Individuals with Visual Impairments

要約 視覚障害のある人口、特に重度の視覚障害者は現在大きく、日々の活動は彼らにと … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.HC, cs.MM | ‘I Can See Forever!’: Evaluating Real-time VideoLLMs for Assisting Individuals with Visual Impairments はコメントを受け付けていません

Defining and Quantifying Creative Behavior in Popular Image Generators

要約 生成AIモデルの創造性は、決定的な答えなしに、過去数年間で科学的議論の対象 … 続きを読む

カテゴリー: cs.AI, cs.CV, I.2.m | Defining and Quantifying Creative Behavior in Popular Image Generators はコメントを受け付けていません

Leveraging Simultaneous Usage of Edge GPU Hardware Engines for Video Face Detection and Recognition

要約 セキュリティの強化や認可された会場への非接触アクセスなど、いくつかのアプリ … 続きを読む

カテゴリー: cs.AR, cs.CV, eess.IV | Leveraging Simultaneous Usage of Edge GPU Hardware Engines for Video Face Detection and Recognition はコメントを受け付けていません