cs.CV」カテゴリーアーカイブ

Inverse Painting: Reconstructing The Painting Process

要約 入力された絵画が与えられると、それがどのように描かれたかを示すタイムラプス … 続きを読む

カテゴリー: cs.CV | コメントする

Propose, Assess, Search: Harnessing LLMs for Goal-Oriented Planning in Instructional Videos

要約 目標指向の計画、つまりエージェントを現在の状態から事前定義された目標に移行 … 続きを読む

カテゴリー: cs.CV | コメントする

Uni$^2$Det: Unified and Universal Framework for Prompt-Guided Multi-dataset 3D Detection

要約 Uni$^2$Det は、3D 検出に関する統合された普遍的なマルチデータ … 続きを読む

カテゴリー: cs.CV | コメントする

Supervised Multi-Modal Fission Learning

要約 マルチモーダル データセットから学習すると、補完的な情報を活用し、予測タス … 続きを読む

カテゴリー: cs.CV, cs.LG | コメントする

SpaceMesh: A Continuous Representation for Learning Manifold Surface Meshes

要約 メッシュはビジュアル コンピューティングやシミュレーションで広く使われてい … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.LG | コメントする

DressRecon: Freeform 4D Human Reconstruction from Monocular Video

要約 極端にゆるい衣服や手持ちの物体の相互作用に焦点を当て、単眼ビデオから時間一 … 続きを読む

カテゴリー: cs.CV | コメントする

MM1.5: Methods, Analysis & Insights from Multimodal LLM Fine-tuning

要約 MM1.5 は、テキストが豊富な画像の理解、視覚的な参照とグラウンディング … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | コメントする

Where’s Waldo: Diffusion Features for Personalized Segmentation and Retrieval

要約 パーソナライズされた検索とセグメンテーションは、入力画像と参照インスタンス … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

Enhanced Parking Perception by Multi-Task Fisheye Cross-view Transformers

要約 現在の駐車エリア認識アルゴリズムは、主に限られた範囲内の空きスロットを検出 … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

Enhancing GANs with Contrastive Learning-Based Multistage Progressive Finetuning SNN and RL-Based External Optimization

要約 がん研究、特に早期診断、症例理解、治療戦略設計におけるディープラーニングの … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, eess.IV | コメントする