月別アーカイブ: 2024年7月

PosFormer: Recognizing Complex Handwritten Mathematical Expression with Position Forest Transformer

要約 手書き数式認識 (HMER) は、デジタル化された教育や自動化されたオフィ … 続きを読む

カテゴリー: cs.CV | PosFormer: Recognizing Complex Handwritten Mathematical Expression with Position Forest Transformer はコメントを受け付けていません

Multi-task Prompt Words Learning for Social Media Content Generation

要約 インターネットの急速な発展は人間の生活を大きく変えました。 人間はソーシャ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.MM | Multi-task Prompt Words Learning for Social Media Content Generation はコメントを受け付けていません

Bridging Synthetic and Real Worlds for Pre-training Scene Text Detectors

要約 既存のシーン テキスト検出方法は通常、トレーニングのために広範な実際のデー … 続きを読む

カテゴリー: cs.CV | Bridging Synthetic and Real Worlds for Pre-training Scene Text Detectors はコメントを受け付けていません

Prompting Language-Informed Distribution for Compositional Zero-Shot Learning

要約 組成ゼロショット学習 (CZSL) タスクは、目に見えない組成視覚概念 ( … 続きを読む

カテゴリー: cs.CV | Prompting Language-Informed Distribution for Compositional Zero-Shot Learning はコメントを受け付けていません

Cross Domain Object Detection via Multi-Granularity Confidence Alignment based Mean Teacher

要約 クロスドメインオブジェクト検出は、アノテーション付きソースドメインから知識 … 続きを読む

カテゴリー: cs.CV | Cross Domain Object Detection via Multi-Granularity Confidence Alignment based Mean Teacher はコメントを受け付けていません

Continuous Control with Coarse-to-fine Reinforcement Learning

要約 強化学習 (RL) アルゴリズムのサンプル効率の向上は最近進んでいますが、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO, cs.SY, eess.SY | Continuous Control with Coarse-to-fine Reinforcement Learning はコメントを受け付けていません

BiGym: A Demo-Driven Mobile Bi-Manual Manipulation Benchmark

要約 モバイル双手動デモ駆動ロボット操作のための新しいベンチマークおよび学習環境 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | BiGym: A Demo-Driven Mobile Bi-Manual Manipulation Benchmark はコメントを受け付けていません

Raising the Ceiling: Conflict-Free Local Feature Matching with Dynamic View Switching

要約 現在の特徴マッチング手法は、モデリング機能の向上を優先して、出力をグラウン … 続きを読む

カテゴリー: cs.CV | Raising the Ceiling: Conflict-Free Local Feature Matching with Dynamic View Switching はコメントを受け付けていません

Manipulating Feature Visualizations with Gradient Slingshots

要約 ディープ ニューラル ネットワーク (DNN) は、複雑で多彩な表現を学習 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Manipulating Feature Visualizations with Gradient Slingshots はコメントを受け付けていません

Lightning Fast Video Anomaly Detection via Adversarial Knowledge Distillation

要約 我々は、ビデオの異常検出のための非常に高速なフレームレベルのモデルを提案し … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM, stat.ML | Lightning Fast Video Anomaly Detection via Adversarial Knowledge Distillation はコメントを受け付けていません