cs.CV」カテゴリーアーカイブ

LogogramNLP: Comparing Visual and Textual Representations of Ancient Logographic Writing Systems for NLP

要約 標準の自然言語処理 (NLP) パイプラインは、通常、一連の離散トークンで … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | LogogramNLP: Comparing Visual and Textual Representations of Ancient Logographic Writing Systems for NLP はコメントを受け付けていません

Puppet-Master: Scaling Interactive Video Generation as a Motion Prior for Part-Level Dynamics

要約 パーツレベルのダイナミクスの事前モーションとして機能するインタラクティブな … 続きを読む

カテゴリー: cs.AI, cs.CV | Puppet-Master: Scaling Interactive Video Generation as a Motion Prior for Part-Level Dynamics はコメントを受け付けていません

Arctic-TILT. Business Document Understanding at Sub-Billion Scale

要約 LLM を採用するワークロードの大部分には、PDF またはスキャン コンテ … 続きを読む

カテゴリー: cs.CL, cs.CV | Arctic-TILT. Business Document Understanding at Sub-Billion Scale はコメントを受け付けていません

LiDAR-Event Stereo Fusion with Hallucinations

要約 イベント ステレオ マッチングは、ニューロモーフィック カメラから深度を推 … 続きを読む

カテゴリー: cs.CV | LiDAR-Event Stereo Fusion with Hallucinations はコメントを受け付けていません

ESP-MedSAM: Efficient Self-Prompting SAM for Universal Domain-Generalized Image Segmentation

要約 さまざまなモダリティにわたるディープ ニューラル ネットワークの普遍性と、 … 続きを読む

カテゴリー: cs.CV, eess.IV | ESP-MedSAM: Efficient Self-Prompting SAM for Universal Domain-Generalized Image Segmentation はコメントを受け付けていません

SynopGround: A Large-Scale Dataset for Multi-Paragraph Video Grounding from TV Dramas and Synopses

要約 ビデオ グラウンディングは、マルチモーダル コンテンツの理解における基本的 … 続きを読む

カテゴリー: cs.CV, cs.MM | SynopGround: A Large-Scale Dataset for Multi-Paragraph Video Grounding from TV Dramas and Synopses はコメントを受け付けていません

Compression-Realized Deep Structural Network for Video Quality Enhancement

要約 このペーパーでは、圧縮ビデオの品質向上のタスクに焦点を当てます。 ディープ … 続きを読む

カテゴリー: cs.CV, eess.IV | Compression-Realized Deep Structural Network for Video Quality Enhancement はコメントを受け付けていません

Advancing Prompt Learning through an External Layer

要約 プロンプト学習は、一連のテキスト埋め込みを学習することで、事前トレーニング … 続きを読む

カテゴリー: cs.CV | Advancing Prompt Learning through an External Layer はコメントを受け付けていません

SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries

要約 自動運転車計画アルゴリズムのパフォーマンスを評価するには、ロングテールの安 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO, I.2.6 | SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries はコメントを受け付けていません

Opening the Black Box of 3D Reconstruction Error Analysis with VECTOR

要約 2D 画像から 3D シーンを再構成することは、地球惑星科学や宇宙探査から … 続きを読む

カテゴリー: cs.CV, cs.RO | Opening the Black Box of 3D Reconstruction Error Analysis with VECTOR はコメントを受け付けていません