月別アーカイブ: 2024年4月

BOTH2Hands: Inferring 3D Hands from Both Text Prompts and Body Dynamics

要約 最近出現したテキストからモーションへの進歩により、便利でインタラクティブな … 続きを読む

カテゴリー: cs.CV | BOTH2Hands: Inferring 3D Hands from Both Text Prompts and Body Dynamics はコメントを受け付けていません

Building-road Collaborative Extraction from Remotely Sensed Images via Cross-Interaction

要約 建物は社会的生産と人間の生活の基本的な担い手です。 道路はソーシャル ネッ … 続きを読む

カテゴリー: cs.AI, cs.CV | Building-road Collaborative Extraction from Remotely Sensed Images via Cross-Interaction はコメントを受け付けていません

Data-Efficient Multimodal Fusion on a Single GPU

要約 マルチモーダル アライメントの目標は、マルチモーダル入力間で共有される単一 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Data-Efficient Multimodal Fusion on a Single GPU はコメントを受け付けていません

Diffusion-based inpainting of incomplete Euclidean distance matrices of trajectories generated by a fractional Brownian motion

要約 フラクショナルブラウン軌道 (fBm) は、ランダム性と強力なスケールフリ … 続きを読む

カテゴリー: 68T07, cs.CV, I.2.0 | Diffusion-based inpainting of incomplete Euclidean distance matrices of trajectories generated by a fractional Brownian motion はコメントを受け付けていません

ORacle: Large Vision-Language Models for Knowledge-Guided Holistic OR Domain Modeling

要約 毎日、世界中で数え切れないほどの手術が手術室 (OR) の個別の環境で行わ … 続きを読む

カテゴリー: cs.CV | ORacle: Large Vision-Language Models for Knowledge-Guided Holistic OR Domain Modeling はコメントを受け付けていません

VMamba: Visual State Space Model

要約 畳み込みニューラル ネットワーク (CNN) とビジョン トランスフォーマ … 続きを読む

カテゴリー: cs.CV | VMamba: Visual State Space Model はコメントを受け付けていません

An Evidential-enhanced Tri-Branch Consistency Learning Method for Semi-supervised Medical Image Segmentation

要約 半教師ありセグメンテーションは、大規模な医用画像分析に有望なアプローチを提 … 続きを読む

カテゴリー: cs.CV | An Evidential-enhanced Tri-Branch Consistency Learning Method for Semi-supervised Medical Image Segmentation はコメントを受け付けていません

Identification of Fine-grained Systematic Errors via Controlled Scene Generation

要約 多くの安全性が重要なアプリケーション、特に自動運転では、信頼性の高い物体検 … 続きを読む

カテゴリー: cs.CV | Identification of Fine-grained Systematic Errors via Controlled Scene Generation はコメントを受け付けていません

Implicit Multi-Spectral Transformer: An Lightweight and Effective Visible to Infrared Image Translation Model

要約 コンピュータ ビジョンの分野では、可視光画像は暗い環境ではコントラストが低 … 続きを読む

カテゴリー: cs.CV | Implicit Multi-Spectral Transformer: An Lightweight and Effective Visible to Infrared Image Translation Model はコメントを受け付けていません

VLLMs Provide Better Context for Emotion Understanding Through Common Sense Reasoning

要約 文脈の中で感情を認識するには、周囲のシーンからの文脈上の手がかりを考慮して … 続きを読む

カテゴリー: cs.CV, cs.HC | VLLMs Provide Better Context for Emotion Understanding Through Common Sense Reasoning はコメントを受け付けていません