月別アーカイブ: 2025年5月

FA-KPConv: Introducing Euclidean Symmetries to KPConv via Frame Averaging

要約 3Dポイントクラウド分析のために広く採用されているバックボーンである、よく … 続きを読む

カテゴリー: cs.CV | FA-KPConv: Introducing Euclidean Symmetries to KPConv via Frame Averaging はコメントを受け付けていません

Efficient Flow Matching using Latent Variables

要約 フローマッチングモデルは、確率的生成モデルの間で画像生成タスクに大きな可能 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Efficient Flow Matching using Latent Variables はコメントを受け付けていません

‘I Can See Forever!’: Evaluating Real-time VideoLLMs for Assisting Individuals with Visual Impairments

要約 視覚障害のある人口、特に重度の視覚障害者は現在大きく、日々の活動は彼らにと … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.HC, cs.MM | ‘I Can See Forever!’: Evaluating Real-time VideoLLMs for Assisting Individuals with Visual Impairments はコメントを受け付けていません

Defining and Quantifying Creative Behavior in Popular Image Generators

要約 生成AIモデルの創造性は、決定的な答えなしに、過去数年間で科学的議論の対象 … 続きを読む

カテゴリー: cs.AI, cs.CV, I.2.m | Defining and Quantifying Creative Behavior in Popular Image Generators はコメントを受け付けていません

Leveraging Simultaneous Usage of Edge GPU Hardware Engines for Video Face Detection and Recognition

要約 セキュリティの強化や認可された会場への非接触アクセスなど、いくつかのアプリ … 続きを読む

カテゴリー: cs.AR, cs.CV, eess.IV | Leveraging Simultaneous Usage of Edge GPU Hardware Engines for Video Face Detection and Recognition はコメントを受け付けていません

XLD: A Cross-Lane Dataset for Benchmarking Novel Driving View Synthesis

要約 自律運転車の安全性を確保するには、シミュレーションによる自律システムの包括 … 続きを読む

カテゴリー: cs.CV | XLD: A Cross-Lane Dataset for Benchmarking Novel Driving View Synthesis はコメントを受け付けていません

HunyuanCustom: A Multimodal-Driven Architecture for Customized Video Generation

要約 カスタマイズされたビデオジェネレーションは、柔軟なユーザー定義条件下で特定 … 続きを読む

カテゴリー: cs.CV | HunyuanCustom: A Multimodal-Driven Architecture for Customized Video Generation はコメントを受け付けていません

Text2CT: Towards 3D CT Volume Generation from Free-text Descriptions Using Diffusion Model

要約 記述的なフリーテキスト入力から3D CTボリュームを生成することは、診断と … 続きを読む

カテゴリー: cs.CV | Text2CT: Towards 3D CT Volume Generation from Free-text Descriptions Using Diffusion Model はコメントを受け付けていません

Edge-GPU Based Face Tracking for Face Detection and Recognition Acceleration

要約 リアルタイムで正確な顔の検出と公共の場所での認識に特化した費用対効果の高い … 続きを読む

カテゴリー: cs.AR, cs.CV, cs.LG, eess.IV | Edge-GPU Based Face Tracking for Face Detection and Recognition Acceleration はコメントを受け付けていません

DFVO: Learning Darkness-free Visible and Infrared Image Disentanglement and Fusion All at Once

要約 可視および赤外線融合は、画像融合の分野で最も重要なタスクの1つであり、高レ … 続きを読む

カテゴリー: cs.AI, cs.CV | DFVO: Learning Darkness-free Visible and Infrared Image Disentanglement and Fusion All at Once はコメントを受け付けていません