投稿者「jarxiv」のアーカイブ

Learning Real Facial Concepts for Independent Deepfake Detection

投稿日: 2025年5月8日作成者: jarxiv

要約 DeepFake検出モデルは、目標ドメインの偽物として実際のインスタンスを … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Question-Answering Dense Video Events

投稿日: 2025年5月8日作成者: jarxiv

要約このペーパーでは、密集したビデオイベントに関する質問を提示します。これは、 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM | コメントを受け付けていません

Ming-Lite-Uni: Advancements in Unified Architecture for Natural Multimodal Interaction

投稿日: 2025年5月8日作成者: jarxiv

要約 Ming-Lite-Uniは、新しく設計された統一された視覚ジェネレーター … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

CAD-Llama: Leveraging Large Language Models for Computer-Aided Design Parametric 3D Model Generation

投稿日: 2025年5月8日作成者: jarxiv

要約最近、大規模な言語モデル（LLM）が大幅に成功し、一般的なテキストを超えて … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Bayesian computation with generative diffusion models by Multilevel Monte Carlo

投稿日: 2025年5月8日作成者: jarxiv

要約生成的拡散モデルは最近、ベイジアンの逆問題で確率的サンプリングを実行する強 … 続きを読む →

カテゴリー: cs.CV, cs.LG, stat.CO | コメントを受け付けていません

FA-KPConv: Introducing Euclidean Symmetries to KPConv via Frame Averaging

投稿日: 2025年5月8日作成者: jarxiv

要約 3Dポイントクラウド分析のために広く採用されているバックボーンである、よく … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Efficient Flow Matching using Latent Variables

投稿日: 2025年5月8日作成者: jarxiv

要約フローマッチングモデルは、確率的生成モデルの間で画像生成タスクに大きな可能 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

‘I Can See Forever!’: Evaluating Real-time VideoLLMs for Assisting Individuals with Visual Impairments

投稿日: 2025年5月8日作成者: jarxiv

要約視覚障害のある人口、特に重度の視覚障害者は現在大きく、日々の活動は彼らにと … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.HC, cs.MM | コメントを受け付けていません

Defining and Quantifying Creative Behavior in Popular Image Generators

投稿日: 2025年5月8日作成者: jarxiv

要約生成AIモデルの創造性は、決定的な答えなしに、過去数年間で科学的議論の対象 … 続きを読む →

カテゴリー: cs.AI, cs.CV, I.2.m | コメントを受け付けていません

Leveraging Simultaneous Usage of Edge GPU Hardware Engines for Video Face Detection and Recognition

投稿日: 2025年5月8日作成者: jarxiv

要約セキュリティの強化や認可された会場への非接触アクセスなど、いくつかのアプリ … 続きを読む →

カテゴリー: cs.AR, cs.CV, eess.IV | コメントを受け付けていません

投稿者「jarxiv」のアーカイブ

Learning Real Facial Concepts for Independent Deepfake Detection

Question-Answering Dense Video Events

Ming-Lite-Uni: Advancements in Unified Architecture for Natural Multimodal Interaction

CAD-Llama: Leveraging Large Language Models for Computer-Aided Design Parametric 3D Model Generation

Bayesian computation with generative diffusion models by Multilevel Monte Carlo

FA-KPConv: Introducing Euclidean Symmetries to KPConv via Frame Averaging

Efficient Flow Matching using Latent Variables

‘I Can See Forever!’: Evaluating Real-time VideoLLMs for Assisting Individuals with Visual Impairments

Defining and Quantifying Creative Behavior in Popular Image Generators

Leveraging Simultaneous Usage of Edge GPU Hardware Engines for Video Face Detection and Recognition

最近の投稿

最近のコメント

アーカイブ

カテゴリー