投稿者「jarxiv」のアーカイブ

Talk is Not Always Cheap: Promoting Wireless Sensing Models with Text Prompts

要約 WiFi、ミリメートル波(MMWAVE)レーダー、無線周波数識別(RFID … 続きを読む

カテゴリー: cs.CV | コメントする

Visual Place Cell Encoding: A Computational Model for Spatial Representation and Cognitive Mapping

要約 このホワイトペーパーでは、視覚入力を使用して場所セルのような活性化をシミュ … 続きを読む

カテゴリー: cs.CV, cs.RO | コメントする

Onboard Satellite Image Classification for Earth Observation: A Comparative Study of ViT Models

要約 この研究は、オンボード衛星処理における土地利用分類の最も効果的な事前訓練モ … 続きを読む

カテゴリー: cs.CV, eess.SP | コメントする

FreeGraftor: Training-Free Cross-Image Feature Grafting for Subject-Driven Text-to-Image Generation

要約 対象主導の画像生成は、テキストガイダンスを順守しながら、主題のアイデンティ … 続きを読む

カテゴリー: cs.CV | コメントする

Is Large-Scale Pretraining the Secret to Good Domain Generalization?

要約 マルチソースドメイン一般化(DG)は、複数のソースドメインでトレーニングし … 続きを読む

カテゴリー: cs.CV, cs.LG | コメントする

Recent Advances and Future Directions in Extended Reality (XR): Exploring AI-Powered Spatial Intelligence

要約 拡張現実(XR)、拡張現実(AR)、バーチャルリアリティ(VR)、および混 … 続きを読む

カテゴリー: cs.CV, cs.HC, cs.MA | コメントする

A New Graph Grammar Formalism for Robust Syntactic Pattern Recognition

要約 再帰的に構造化されたグラフ様パターンの構文を表すための形式を紹介します。 … 続きを読む

カテゴリー: cs.CV, cs.FL, F.4.2 | コメントする

Efficient Adaptation of Deep Neural Networks for Semantic Segmentation in Space Applications

要約 近年、深い学習技術の適用は、さまざまなコンピュータービジョンタスクで顕著な … 続きを読む

カテゴリー: cs.CV, cs.LG | コメントする

MVQA: Mamba with Unified Sampling for Efficient Video Quality Assessment

要約 長期の高解像度ビデオの急速な成長により、効率的なビデオ品質評価(VQA)が … 続きを読む

カテゴリー: cs.CV | コメントする

Efficient Temporal Consistency in Diffusion-Based Video Editing with Adaptor Modules: A Theoretical Framework

要約 アダプターベースの方法は、特にフレーム間の一貫性を必要とするビデオ編集タス … 続きを読む

カテゴリー: cs.CV | コメントする