月別アーカイブ: 2024年7月

3D Human Mesh Estimation from Virtual Markers

要約 体積測定による 3D 姿勢推定の成功に触発されて、一部の最近のヒューマン … 続きを読む

カテゴリー: cs.CV | 3D Human Mesh Estimation from Virtual Markers はコメントを受け付けていません

RoadFormer: Duplex Transformer for RGB-Normal Semantic Road Scene Parsing

要約 ディープ畳み込みニューラル ネットワークの最近の進歩は、道路シーンの解析の … 続きを読む

カテゴリー: cs.CV, cs.RO | RoadFormer: Duplex Transformer for RGB-Normal Semantic Road Scene Parsing はコメントを受け付けていません

VTG-LLM: Integrating Timestamp Knowledge into Video LLMs for Enhanced Video Temporal Grounding

要約 Video Temporal Grounding(VTG)は、言語クエリに … 続きを読む

カテゴリー: cs.CV | VTG-LLM: Integrating Timestamp Knowledge into Video LLMs for Enhanced Video Temporal Grounding はコメントを受け付けていません

A Simple Framework for Open-Vocabulary Zero-Shot Segmentation

要約 ゼロショット分類機能は、視覚言語の対照的なフレームワーク内でトレーニングさ … 続きを読む

カテゴリー: cs.CV | A Simple Framework for Open-Vocabulary Zero-Shot Segmentation はコメントを受け付けていません

YOLOv10 to Its Genesis: A Decadal and Comprehensive Review of The You Only Look Once Series

要約 このレビューでは、YOLOv1 から最近発表された YOLOv10 までの … 続きを読む

カテゴリー: cs.CV | YOLOv10 to Its Genesis: A Decadal and Comprehensive Review of The You Only Look Once Series はコメントを受け付けていません

Training morphological neural networks with gradient descent: some theoretical insights

要約 形態学的ニューラル ネットワーク (レイヤー) は、完全な格子演算子の表現 … 続きを読む

カテゴリー: cs.CV, cs.LG, stat.ML | Training morphological neural networks with gradient descent: some theoretical insights はコメントを受け付けていません

VIPriors 4: Visual Inductive Priors for Data-Efficient Deep Learning Challenges

要約 「VIPriors: データ効率の高い深層学習のための視覚的帰納的事前分布 … 続きを読む

カテゴリー: cs.CV | VIPriors 4: Visual Inductive Priors for Data-Efficient Deep Learning Challenges はコメントを受け付けていません

E-ANT: A Large-Scale Dataset for Efficient Automatic GUI NavigaTion

要約 モバイル デバイス上のオンライン GUI ナビゲーションは、多くの実世界の … 続きを読む

カテゴリー: cs.CV, cs.HC | E-ANT: A Large-Scale Dataset for Efficient Automatic GUI NavigaTion はコメントを受け付けていません

DynamicGlue: Epipolar and Time-Informed Data Association in Dynamic Environments using Graph Neural Networks

要約 静的環境の想定は、SLAM などの多くの幾何学的なコンピューター ビジョン … 続きを読む

カテゴリー: cs.CV, cs.RO | DynamicGlue: Epipolar and Time-Informed Data Association in Dynamic Environments using Graph Neural Networks はコメントを受け付けていません

PosterLLaVa: Constructing a Unified Multi-modal Layout Generator with LLM

要約 レイアウト生成は、自動グラフィック デザインを実現するための要であり、さま … 続きを読む

カテゴリー: cs.CV | PosterLLaVa: Constructing a Unified Multi-modal Layout Generator with LLM はコメントを受け付けていません