月別アーカイブ: 2024年1月

TIER: Text and Image Encoder-based Regression for AIGC Image Quality Assessment

要約 最近、人間の知覚の観点から AI が生成した画像の品質を評価することを目的 … 続きを読む

カテゴリー: cs.AI, cs.CV | TIER: Text and Image Encoder-based Regression for AIGC Image Quality Assessment はコメントを受け付けていません

A Contrastive Learning Scheme with Transformer Innate Patches

要約 この論文では、Transformer の固有パッチを使用した対照学習スキー … 続きを読む

カテゴリー: cs.AI, cs.CV | A Contrastive Learning Scheme with Transformer Innate Patches はコメントを受け付けていません

Gramformer: Learning Crowd Counting via Graph-Modulated Transformer

要約 Transformer は、従来の CNN の限られた受容領域を打ち破るた … 続きを読む

カテゴリー: cs.CV | Gramformer: Learning Crowd Counting via Graph-Modulated Transformer はコメントを受け付けていません

A New Dataset and a Distractor-Aware Architecture for Transparent Object Tracking

要約 最新のトラッカーのパフォーマンスは、不透明なオブジェクトに比べて透明なオブ … 続きを読む

カテゴリー: cs.CV | A New Dataset and a Distractor-Aware Architecture for Transparent Object Tracking はコメントを受け付けていません

Revisiting Color-Event based Tracking: A Unified Network, Dataset, and Metric

要約 カラー カメラとイベント カメラ (ダイナミック ビジョン センサー、DV … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.NE | Revisiting Color-Event based Tracking: A Unified Network, Dataset, and Metric はコメントを受け付けていません

DamWorld: Progressive Reasoning with World Models for Robotic Manipulation

要約 身体化された AI の研究は、ロボット操作の開発を大きく促進しました。 た … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | DamWorld: Progressive Reasoning with World Models for Robotic Manipulation はコメントを受け付けていません

Unlocking Pre-trained Image Backbones for Semantic Image Synthesis

要約 セマンティック画像合成、つまりユーザーが提供したセマンティックラベルマップ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Unlocking Pre-trained Image Backbones for Semantic Image Synthesis はコメントを受け付けていません

Ranking-based Adaptive Query Generation for DETRs in Crowded Pedestrian Detection

要約 DEtection TRansformer (DETR) とそのバリアント … 続きを読む

カテゴリー: cs.CV | Ranking-based Adaptive Query Generation for DETRs in Crowded Pedestrian Detection はコメントを受け付けていません

A Survey on 3D Gaussian Splatting

要約 3D ガウス スプラッティング (3D GS) は、明示的な放射輝度フィー … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.MM | A Survey on 3D Gaussian Splatting はコメントを受け付けていません

STAIR: Spatial-Temporal Reasoning with Auditable Intermediate Results for Video Question Answering

要約 最近、ビデオ質問応答モデルの急速な発展を目の当たりにしました。 ただし、ほ … 続きを読む

カテゴリー: cs.CL, cs.CV | STAIR: Spatial-Temporal Reasoning with Auditable Intermediate Results for Video Question Answering はコメントを受け付けていません