月別アーカイブ: 2024年6月

Matching Anything by Segmenting Anything

投稿日: 2024年6月7日作成者: jarxiv

要約複雑なシーンのビデオフレーム全体で同じオブジェクトを確実に関連付けること … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Wake Vision: A Large-scale, Diverse Dataset and Benchmark Suite for TinyML Person Detection

投稿日: 2024年6月7日作成者: jarxiv

要約非常に低電力のデバイス上で機械学習アプリケーションを可能にする Tiny … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

R-CONV: An Analytical Approach for Efficient Data Reconstruction via Convolutional Gradients

投稿日: 2024年6月7日作成者: jarxiv

要約分散データの広範なコレクションから学習する取り組みにおいて、フェデレーショ … 続きを読む →

カテゴリー: cs.CR, cs.CV, cs.LG | コメントを受け付けていません

M3LEO: A Multi-Modal, Multi-Label Earth Observation Dataset Integrating Interferometric SAR and RGB Data

投稿日: 2024年6月7日作成者: jarxiv

要約衛星ベースのリモートセンシングは、急速に進化する世界で地球規模の課題に対 … 続きを読む →

カテゴリー: cs.AI, cs.CV, I.4 | コメントを受け付けていません

Understanding Information Storage and Transfer in Multi-modal Large Language Models

投稿日: 2024年6月7日作成者: jarxiv

要約 Transformer ベースのモデルにおける情報の保存と転送のメカニズム … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Conv-INR: Convolutional Implicit Neural Representation for Multimodal Visual Signals

投稿日: 2024年6月7日作成者: jarxiv

要約暗黙的ニューラル表現 (INR) は、信号表現の有望なパラダイムとして最近 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Localized Gaussian Point Management

投稿日: 2024年6月7日作成者: jarxiv

要約ポイントの開始 (モーションからの構造などによる) が分布的に不適切である … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

A Survey on 3D Human Avatar Modeling — From Reconstruction to Generation

投稿日: 2024年6月7日作成者: jarxiv

要約 3D モデリングは、長い間、コンピュータービジョンおよびコンピューター … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

GeoGen: Geometry-Aware Generative Modeling via Signed Distance Functions

投稿日: 2024年6月7日作成者: jarxiv

要約単一ビューのコレクションから 3D ジオメトリと画像を合成するための新しい … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

MLVU: A Comprehensive Benchmark for Multi-Task Long Video Understanding

投稿日: 2024年6月7日作成者: jarxiv

要約 Long Video Understanding (LVU) パフォーマン … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

月別アーカイブ: 2024年6月

Matching Anything by Segmenting Anything

Wake Vision: A Large-scale, Diverse Dataset and Benchmark Suite for TinyML Person Detection

R-CONV: An Analytical Approach for Efficient Data Reconstruction via Convolutional Gradients

M3LEO: A Multi-Modal, Multi-Label Earth Observation Dataset Integrating Interferometric SAR and RGB Data

Understanding Information Storage and Transfer in Multi-modal Large Language Models

Conv-INR: Convolutional Implicit Neural Representation for Multimodal Visual Signals

Localized Gaussian Point Management

A Survey on 3D Human Avatar Modeling — From Reconstruction to Generation

GeoGen: Geometry-Aware Generative Modeling via Signed Distance Functions

MLVU: A Comprehensive Benchmark for Multi-Task Long Video Understanding

最近の投稿

最近のコメント

アーカイブ

カテゴリー