月別アーカイブ: 2024年4月

EGTR: Extracting Graph from Transformer for Scene Graph Generation

要約 シーン グラフ生成 (SGG) は、オブジェクトを検出し、オブジェクト間の … 続きを読む

カテゴリー: cs.CV, cs.LG | EGTR: Extracting Graph from Transformer for Scene Graph Generation はコメントを受け付けていません

Plug-and-Play image restoration with Stochastic deNOising REgularization

要約 プラグ アンド プレイ (PnP) アルゴリズムは、物理モデルと正則化のた … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV, stat.ML | Plug-and-Play image restoration with Stochastic deNOising REgularization はコメントを受け付けていません

PlatoNeRF: 3D Reconstruction in Plato’s Cave via Single-View Two-Bounce Lidar

要約 単一ビューからの 3D 再構成は、単眼の手がかりによるあいまいさと、遮蔽さ … 続きを読む

カテゴリー: cs.CV, eess.IV | PlatoNeRF: 3D Reconstruction in Plato’s Cave via Single-View Two-Bounce Lidar はコメントを受け付けていません

MarsSeg: Mars Surface Semantic Segmentation with Multi-level Extractor and Connector

要約 火星表面のセグメンテーションと解釈は火星探査において極めて重要な役割を果た … 続きを読む

カテゴリー: cs.CV | MarsSeg: Mars Surface Semantic Segmentation with Multi-level Extractor and Connector はコメントを受け付けていません

Noisy Label Processing for Classification: A Survey

要約 近年、ディープ ニューラル ネットワーク (DNN) はコンピューター ビ … 続きを読む

カテゴリー: cs.AI, cs.CV | Noisy Label Processing for Classification: A Survey はコメントを受け付けていません

Chat-UniVi: Unified Visual Representation Empowers Large Language Models with Image and Video Understanding

要約 大規模な言語モデルは、広範囲にわたる無制限のタスクにわたって優れた普遍的な … 続きを読む

カテゴリー: cs.CV | Chat-UniVi: Unified Visual Representation Empowers Large Language Models with Image and Video Understanding はコメントを受け付けていません

Self-Correcting Self-Consuming Loops for Generative Model Training

要約 合成データの品質が高くなり、インターネット上で急増するにつれて、機械学習モ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, stat.ML | Self-Correcting Self-Consuming Loops for Generative Model Training はコメントを受け付けていません

Embedded Heterogeneous Attention Transformer for Cross-lingual Image Captioning

要約 クロスリンガルの画像キャプション付けは、マルチメディア分析におけるクロスリ … 続きを読む

カテゴリー: cs.CV, cs.MM | Embedded Heterogeneous Attention Transformer for Cross-lingual Image Captioning はコメントを受け付けていません

SCAResNet: A ResNet Variant Optimized for Tiny Object Detection in Transmission and Distribution Towers

要約 従来の深層学習ベースの物体検出ネットワークでは、特徴マップ内で均一なサイズ … 続きを読む

カテゴリー: cs.CV | SCAResNet: A ResNet Variant Optimized for Tiny Object Detection in Transmission and Distribution Towers はコメントを受け付けていません

SWAG: Splatting in the Wild images with Appearance-conditioned Gaussians

要約 暗黙的ニューラル表現手法は、構造化されていない自然界の写真コレクションから … 続きを読む

カテゴリー: cs.CV | SWAG: Splatting in the Wild images with Appearance-conditioned Gaussians はコメントを受け付けていません