月別アーカイブ: 2024年2月

Scaffolding Coordinates to Promote Vision-Language Coordination in Large Multi-Modal Models

要約 最先端の大規模マルチモーダル モデル (LMM) は、視覚言語タスクにおい … 続きを読む

カテゴリー: cs.CL, cs.CV | Scaffolding Coordinates to Promote Vision-Language Coordination in Large Multi-Modal Models はコメントを受け付けていません

Immediate generalisation in humans but a generalisation lag in deep neural networks — evidence for representational divergence?

要約 最近の研究では、画像分類の分野で人間とディープ ニューラル ネットワーク … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, q-bio.NC | Immediate generalisation in humans but a generalisation lag in deep neural networks — evidence for representational divergence? はコメントを受け付けていません

CapHuman: Capture Your Moments in Parallel Universes

要約 私たちは、人間中心の新しい画像合成タスクに焦点を当てます。つまり、参照顔写 … 続きを読む

カテゴリー: cs.AI, cs.CV | CapHuman: Capture Your Moments in Parallel Universes はコメントを受け付けていません

Robustness and Exploration of Variational and Machine Learning Approaches to Inverse Problems: An Overview

要約 この論文は、変分法と機械学習を使用してイメージングにおける逆問題を解決する … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.NA, eess.IV, math.NA | Robustness and Exploration of Variational and Machine Learning Approaches to Inverse Problems: An Overview はコメントを受け付けていません

Dynamic Path-Controllable Deep Unfolding Network for Compressive Sensing

要約 最適化アルゴリズムをディープ ニューラル ネットワークに展開するディープ … 続きを読む

カテゴリー: cs.CV, eess.IV | Dynamic Path-Controllable Deep Unfolding Network for Compressive Sensing はコメントを受け付けていません

LVCHAT: Facilitating Long Video Comprehension

要約 大規模言語モデル (LLM) でビデオを読み取れるようにすることは、マルチ … 続きを読む

カテゴリー: cs.CL, cs.CV | LVCHAT: Facilitating Long Video Comprehension はコメントを受け付けていません

On Image Search in Histopathology

要約 組織病理学の病理画像は、カメラに取り付けられた顕微鏡またはホールスライドス … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.IR, eess.IV, q-bio.QM | On Image Search in Histopathology はコメントを受け付けていません

Major TOM: Expandable Datasets for Earth Observation

要約 深層学習モデルはますますデータを必要とし、トレーニングに必要なデータセット … 続きを読む

カテゴリー: cs.CV, cs.DB | Major TOM: Expandable Datasets for Earth Observation はコメントを受け付けていません

Towards Explainable LiDAR Point Cloud Semantic Segmentation via Gradient Based Target Localization

要約 LiDAR 点群のセマンティック セグメンテーション (SS) は、都市計 … 続きを読む

カテゴリー: cs.AI, cs.CV | Towards Explainable LiDAR Point Cloud Semantic Segmentation via Gradient Based Target Localization はコメントを受け付けていません

Human Video Translation via Query Warping

要約 この論文では、時間的に一貫した人間の動きのビデオ翻訳のための新しいフレーム … 続きを読む

カテゴリー: cs.CV | Human Video Translation via Query Warping はコメントを受け付けていません