cs.CV」カテゴリーアーカイブ

Virtual Guidance as a Mid-level Representation for Navigation with Augmented Reality

要約 自律的なナビゲーションのコンテキストでは、特にナビゲーション情報がビジョン … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Virtual Guidance as a Mid-level Representation for Navigation with Augmented Reality はコメントを受け付けていません

A Benchmarking Study of Vision-based Robotic Grasping Algorithms

要約 明確なアプローチを備えたビジョンベースのロボットグラスピングアルゴリズムの … 続きを読む

カテゴリー: 68T99, cs.CV, cs.RO | A Benchmarking Study of Vision-based Robotic Grasping Algorithms はコメントを受け付けていません

LIX: Implicitly Infusing Spatial Geometric Prior Knowledge into Visual Semantic Segmentation for Autonomous Driving

要約 視覚セマンティックセグメンテーションのために二重エンコーダを使用してデータ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | LIX: Implicitly Infusing Spatial Geometric Prior Knowledge into Visual Semantic Segmentation for Autonomous Driving はコメントを受け付けていません

Prof. Robot: Differentiable Robot Rendering Without Static and Self-Collisions

要約 微分可能なレンダリングは、ロボット工学の分野で大きな注目を集めており、微分 … 続きを読む

カテゴリー: cs.CV, cs.RO | Prof. Robot: Differentiable Robot Rendering Without Static and Self-Collisions はコメントを受け付けていません

Enhancing Hand Palm Motion Gesture Recognition by Eliminating Reference Frame Bias via Frame-Invariant Similarity Measures

要約 ロボットが人間のジェスチャーを認識する能力は、自然でアクセス可能な人間のロ … 続きを読む

カテゴリー: 53A55, 53Z30, 70B10, cs.CV, cs.HC, cs.RO, I.5.m | Enhancing Hand Palm Motion Gesture Recognition by Eliminating Reference Frame Bias via Frame-Invariant Similarity Measures はコメントを受け付けていません

Step-Video-TI2V Technical Report: A State-of-the-Art Text-Driven Image-to-Video Generation Model

要約 テキストと画像の両方の入力に基づいて最大102フレームのビデオを生成できる … 続きを読む

カテゴリー: cs.CL, cs.CV | Step-Video-TI2V Technical Report: A State-of-the-Art Text-Driven Image-to-Video Generation Model はコメントを受け付けていません

Cardiomyopathy Diagnosis Model from Endomyocardial Biopsy Specimens: Appropriate Feature Space and Class Boundary in Small Sample Size Data

要約 心不全の患者の数が増えると、機械学習(ML)は、病理学者の不足によって駆動 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Cardiomyopathy Diagnosis Model from Endomyocardial Biopsy Specimens: Appropriate Feature Space and Class Boundary in Small Sample Size Data はコメントを受け付けていません

PARIC: Probabilistic Attention Regularization for Language Guided Image Classification from Pre-trained Vison Language Models

要約 言語誘導の注意フレームワークは、画像分類における解釈可能性とパフォーマンス … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | PARIC: Probabilistic Attention Regularization for Language Guided Image Classification from Pre-trained Vison Language Models はコメントを受け付けていません

BEVDiffLoc: End-to-End LiDAR Global Localization in BEV View based on Diffusion Model

要約 ローカリゼーションは、現代のロボット工学の中核部分の1つです。 通常、古典 … 続きを読む

カテゴリー: cs.CV, cs.RO | BEVDiffLoc: End-to-End LiDAR Global Localization in BEV View based on Diffusion Model はコメントを受け付けていません

Deepfake Detection of Face Images based on a Convolutional Neural Network

要約 偽のニュース、特にディープフェイク(生成された、非現実的な画像またはビデオ … 続きを読む

カテゴリー: cs.CV, cs.LG | Deepfake Detection of Face Images based on a Convolutional Neural Network はコメントを受け付けていません