月別アーカイブ: 2024年7月

Revolutionizing Text-to-Image Retrieval as Autoregressive Token-to-Voken Generation

要約 テキストから画像への取得は、意味的に関連するクロスモーダル コンテンツを取 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | Revolutionizing Text-to-Image Retrieval as Autoregressive Token-to-Voken Generation はコメントを受け付けていません

EventBind: Learning a Unified Representation to Bind Them All for Event-based Open-world Understanding

要約 この論文では、大規模なイベントベースのデータセットの欠如を補うために、イベ … 続きを読む

カテゴリー: cs.CV | EventBind: Learning a Unified Representation to Bind Them All for Event-based Open-world Understanding はコメントを受け付けていません

TLControl: Trajectory and Language Control for Human Motion Synthesis

要約 制御可能な人間のモーション合成は、AR/VR、ゲーム、および身体型 AI … 続きを読む

カテゴリー: cs.CV, cs.GR | TLControl: Trajectory and Language Control for Human Motion Synthesis はコメントを受け付けていません

Multimodal Query-guided Object Localization

要約 ワンショットのクエリガイドによるオブジェクト位置特定において、オブジェクト … 続きを読む

カテゴリー: cs.CV | Multimodal Query-guided Object Localization はコメントを受け付けていません

How Good (Or Bad) Are LLMs at Detecting Misleading Visualizations?

要約 この研究では、情報伝達の完全性を損なう蔓延している問題である、誤解を招くチ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.HC | How Good (Or Bad) Are LLMs at Detecting Misleading Visualizations? はコメントを受け付けていません

MutDet: Mutually Optimizing Pre-training for Remote Sensing Object Detection

要約 DETR シリーズ検出器の検出事前トレーニング方法は、DETReg などの … 続きを読む

カテゴリー: cs.CV | MutDet: Mutually Optimizing Pre-training for Remote Sensing Object Detection はコメントを受け付けていません

LangOcc: Self-Supervised Open Vocabulary Occupancy Estimation via Volume Rendering

要約 セマンティック占有は、3D シーン表現の有力な方法として最近大きな注目を集 … 続きを読む

カテゴリー: cs.CV | LangOcc: Self-Supervised Open Vocabulary Occupancy Estimation via Volume Rendering はコメントを受け付けていません

Physical Adversarial Attack on Monocular Depth Estimation via Shape-Varying Patches

要約 単眼深度推定 (MDE) システムに対する敵対的攻撃は、特に自動運転などの … 続きを読む

カテゴリー: cs.CV | Physical Adversarial Attack on Monocular Depth Estimation via Shape-Varying Patches はコメントを受け付けていません

Enhanced Deep Learning Methodologies and MRI Selection Techniques for Dementia Diagnosis in the Elderly Population

要約 認知症は、世界中で数百万人が罹患している衰弱性の神経疾患であり、診断上重大 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | Enhanced Deep Learning Methodologies and MRI Selection Techniques for Dementia Diagnosis in the Elderly Population はコメントを受け付けていません

DarSwin-Unet: Distortion Aware Encoder-Decoder Architecture

要約 広角魚眼画像は、ロボット工学、セキュリティ、モビリティ (ドローン、航空電 … 続きを読む

カテゴリー: cs.CV | DarSwin-Unet: Distortion Aware Encoder-Decoder Architecture はコメントを受け付けていません