cs.CV」カテゴリーアーカイブ

FracGM: A Fast Fractional Programming Technique for Geman-McClure Robust Estimator

要約 コンピューター ビジョン、ロボット工学、ナビゲーションでは確実な推定が不可 … 続きを読む

カテゴリー: cs.CV, cs.RO, math.OC | コメントする

TinyVLA: Towards Fast, Data-Efficient Vision-Language-Action Models for Robotic Manipulation

要約 視覚-言語-動作 (VLA) モデルは、エンドツーエンドの学習プロセスを通 … 続きを読む

カテゴリー: cs.CV, cs.RO | コメントする

2D or not 2D: How Does the Dimensionality of Gesture Representation Affect 3D Co-Speech Gesture Generation?

要約 共同スピーチのジェスチャーはコミュニケーションの基本です。 最近の深層学習 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG, cs.SD, eess.AS | コメントする

Hierarchical Windowed Graph Attention Network and a Large Scale Dataset for Isolated Indian Sign Language Recognition

要約 自動手話 (SL) 認識は、コンピューター ビジョン コミュニティにおける … 続きを読む

カテゴリー: cs.CL, cs.CV | コメントする

Learning from Pattern Completion: Self-supervised Controllable Generation

要約 人間の脳は、通常は情報を監視することなく、スケッチや落書きを現実世界の視覚 … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

Multi-modal Medical Image Fusion For Non-Small Cell Lung Cancer Classification

要約 世界中のがん死亡の主な原因である非小細胞肺がん(NSCLC)の早期発見と微 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | コメントする

I2EBench: A Comprehensive Benchmark for Instruction-based Image Editing

要約 命令ベースの画像編集 (IIE) の分野では大きな進歩が見られました。 た … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

A Generalized Tensor Formulation for Hyperspectral Image Super-Resolution Under General Spatial Blurring

要約 ハイパースペクトル超解像は一般に、低空間解像度のハイパースペクトル イメー … 続きを読む

カテゴリー: cs.CV, eess.IV | コメントする

Effectiveness of learning-based image codecs on fingerprint storage

要約 学習ベースのコーディング技術の成功と、JPEG-AI などの学習ベースの画 … 続きを読む

カテゴリー: cs.CV, eess.IV | コメントする

Diffusion-based RGB-D Semantic Segmentation with Deformable Attention Transformer

要約 視覚に基づいた認識と推論は、自律システムにおけるシーンの理解に不可欠です。 … 続きを読む

カテゴリー: cs.CV | コメントする