cs.AI」カテゴリーアーカイブ

Building-road Collaborative Extraction from Remotely Sensed Images via Cross-Interaction

要約 建物は社会的生産と人間の生活の基本的な担い手です。 道路はソーシャル ネッ … 続きを読む

カテゴリー: cs.AI, cs.CV | Building-road Collaborative Extraction from Remotely Sensed Images via Cross-Interaction はコメントを受け付けていません

Data-Efficient Multimodal Fusion on a Single GPU

要約 マルチモーダル アライメントの目標は、マルチモーダル入力間で共有される単一 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Data-Efficient Multimodal Fusion on a Single GPU はコメントを受け付けていません

Location-guided Head Pose Estimation for Fisheye Image

要約 魚眼レンズまたは超広角レンズを備えたカメラは、透視投影ではモデル化できない … 続きを読む

カテゴリー: cs.AI, cs.CV | Location-guided Head Pose Estimation for Fisheye Image はコメントを受け付けていません

Understanding Video Transformers via Universal Concept Discovery

要約 この論文では、ビデオのトランス表現の概念ベースの解釈可能性の問題を研究しま … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Understanding Video Transformers via Universal Concept Discovery はコメントを受け付けていません

Measuring proximity to standard planes during fetal brain ultrasound scanning

要約 この論文では、胎児の脳内の標準平面 (SP) へのより効果的なナビゲーショ … 続きを読む

カテゴリー: cs.AI, cs.CV, I.2.0 | Measuring proximity to standard planes during fetal brain ultrasound scanning はコメントを受け付けていません

Disentangled Explanations of Neural Network Predictions by Finding Relevant Subspaces

要約 Explainable AI は、予測に対する説明を生成することで、ニュー … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Disentangled Explanations of Neural Network Predictions by Finding Relevant Subspaces はコメントを受け付けていません

RealmDreamer: Text-Driven 3D Scene Generation with Inpainting and Depth Diffusion

要約 テキストの説明から一般的な前向き 3D シーンを生成する技術である Rea … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG | RealmDreamer: Text-Driven 3D Scene Generation with Inpainting and Depth Diffusion はコメントを受け付けていません

UMBRAE: Unified Multimodal Decoding of Brain Signals

要約 私たちは、文献では正確な空間情報がほとんど復元されておらず、主題固有のモデ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | UMBRAE: Unified Multimodal Decoding of Brain Signals はコメントを受け付けていません

BRAVE: Broadening the visual encoding of vision-language models

要約 ビジョン言語モデル (VLM) は通常、ビジョン エンコーダで構成されます … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | BRAVE: Broadening the visual encoding of vision-language models はコメントを受け付けていません

GoodDrag: Towards Good Practices for Drag Editing with Diffusion Models

要約 本稿では、ドラッグ編集の安定性と画質を向上させる新しいアプローチである G … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG, cs.MM | GoodDrag: Towards Good Practices for Drag Editing with Diffusion Models はコメントを受け付けていません