月別アーカイブ: 2024年4月

EGTR: Extracting Graph from Transformer for Scene Graph Generation

投稿日: 2024年4月8日作成者: jarxiv

要約シーングラフ生成 (SGG) は、オブジェクトを検出し、オブジェクト間の … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Plug-and-Play image restoration with Stochastic deNOising REgularization

投稿日: 2024年4月8日作成者: jarxiv

要約プラグアンドプレイ (PnP) アルゴリズムは、物理モデルと正則化のた … 続きを読む →

カテゴリー: cs.CV, cs.LG, eess.IV, stat.ML | コメントを受け付けていません

PlatoNeRF: 3D Reconstruction in Plato’s Cave via Single-View Two-Bounce Lidar

投稿日: 2024年4月8日作成者: jarxiv

要約単一ビューからの 3D 再構成は、単眼の手がかりによるあいまいさと、遮蔽さ … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

MarsSeg: Mars Surface Semantic Segmentation with Multi-level Extractor and Connector

投稿日: 2024年4月8日作成者: jarxiv

要約火星表面のセグメンテーションと解釈は火星探査において極めて重要な役割を果た … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Noisy Label Processing for Classification: A Survey

投稿日: 2024年4月8日作成者: jarxiv

要約近年、ディープニューラルネットワーク (DNN) はコンピュータービ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Chat-UniVi: Unified Visual Representation Empowers Large Language Models with Image and Video Understanding

投稿日: 2024年4月8日作成者: jarxiv

要約大規模な言語モデルは、広範囲にわたる無制限のタスクにわたって優れた普遍的な … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Self-Correcting Self-Consuming Loops for Generative Model Training

投稿日: 2024年4月8日作成者: jarxiv

要約合成データの品質が高くなり、インターネット上で急増するにつれて、機械学習モ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, stat.ML | コメントを受け付けていません

Embedded Heterogeneous Attention Transformer for Cross-lingual Image Captioning

投稿日: 2024年4月8日作成者: jarxiv

要約クロスリンガルの画像キャプション付けは、マルチメディア分析におけるクロスリ … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

SCAResNet: A ResNet Variant Optimized for Tiny Object Detection in Transmission and Distribution Towers

投稿日: 2024年4月8日作成者: jarxiv

要約従来の深層学習ベースの物体検出ネットワークでは、特徴マップ内で均一なサイズ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

SWAG: Splatting in the Wild images with Appearance-conditioned Gaussians

投稿日: 2024年4月8日作成者: jarxiv

要約暗黙的ニューラル表現手法は、構造化されていない自然界の写真コレクションから … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2024年4月

EGTR: Extracting Graph from Transformer for Scene Graph Generation

Plug-and-Play image restoration with Stochastic deNOising REgularization

PlatoNeRF: 3D Reconstruction in Plato’s Cave via Single-View Two-Bounce Lidar

MarsSeg: Mars Surface Semantic Segmentation with Multi-level Extractor and Connector

Noisy Label Processing for Classification: A Survey

Chat-UniVi: Unified Visual Representation Empowers Large Language Models with Image and Video Understanding

Self-Correcting Self-Consuming Loops for Generative Model Training

Embedded Heterogeneous Attention Transformer for Cross-lingual Image Captioning

SCAResNet: A ResNet Variant Optimized for Tiny Object Detection in Transmission and Distribution Towers

SWAG: Splatting in the Wild images with Appearance-conditioned Gaussians

最近の投稿

最近のコメント

アーカイブ

カテゴリー