月別アーカイブ: 2024年2月

Scaffolding Coordinates to Promote Vision-Language Coordination in Large Multi-Modal Models

投稿日: 2024年2月20日作成者: jarxiv

要約最先端の大規模マルチモーダルモデル (LMM) は、視覚言語タスクにおい … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Immediate generalisation in humans but a generalisation lag in deep neural networks — evidence for representational divergence?

投稿日: 2024年2月20日作成者: jarxiv

要約最近の研究では、画像分類の分野で人間とディープニューラルネットワーク … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, q-bio.NC | コメントを受け付けていません

CapHuman: Capture Your Moments in Parallel Universes

投稿日: 2024年2月20日作成者: jarxiv

要約私たちは、人間中心の新しい画像合成タスクに焦点を当てます。つまり、参照顔写 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Robustness and Exploration of Variational and Machine Learning Approaches to Inverse Problems: An Overview

投稿日: 2024年2月20日作成者: jarxiv

要約この論文は、変分法と機械学習を使用してイメージングにおける逆問題を解決する … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.NA, eess.IV, math.NA | コメントを受け付けていません

Dynamic Path-Controllable Deep Unfolding Network for Compressive Sensing

投稿日: 2024年2月20日作成者: jarxiv

要約最適化アルゴリズムをディープニューラルネットワークに展開するディープ … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

LVCHAT: Facilitating Long Video Comprehension

投稿日: 2024年2月20日作成者: jarxiv

要約大規模言語モデル (LLM) でビデオを読み取れるようにすることは、マルチ … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

On Image Search in Histopathology

投稿日: 2024年2月20日作成者: jarxiv

要約組織病理学の病理画像は、カメラに取り付けられた顕微鏡またはホールスライドス … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.IR, eess.IV, q-bio.QM | コメントを受け付けていません

Major TOM: Expandable Datasets for Earth Observation

投稿日: 2024年2月20日作成者: jarxiv

要約深層学習モデルはますますデータを必要とし、トレーニングに必要なデータセット … 続きを読む →

カテゴリー: cs.CV, cs.DB | コメントを受け付けていません

Towards Explainable LiDAR Point Cloud Semantic Segmentation via Gradient Based Target Localization

投稿日: 2024年2月20日作成者: jarxiv

要約 LiDAR 点群のセマンティックセグメンテーション (SS) は、都市計 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Human Video Translation via Query Warping

投稿日: 2024年2月20日作成者: jarxiv

要約この論文では、時間的に一貫した人間の動きのビデオ翻訳のための新しいフレーム … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2024年2月

Scaffolding Coordinates to Promote Vision-Language Coordination in Large Multi-Modal Models

Immediate generalisation in humans but a generalisation lag in deep neural networks — evidence for representational divergence?

CapHuman: Capture Your Moments in Parallel Universes

Robustness and Exploration of Variational and Machine Learning Approaches to Inverse Problems: An Overview

Dynamic Path-Controllable Deep Unfolding Network for Compressive Sensing

LVCHAT: Facilitating Long Video Comprehension

On Image Search in Histopathology

Major TOM: Expandable Datasets for Earth Observation

Towards Explainable LiDAR Point Cloud Semantic Segmentation via Gradient Based Target Localization

Human Video Translation via Query Warping

最近の投稿

最近のコメント

アーカイブ

カテゴリー