月別アーカイブ: 2024年6月

A Sparse Graph Formulation for Efficient Spectral Image Segmentation

投稿日: 2024年6月10日作成者: jarxiv

要約スペクトルクラスタリングは、セグメンテーションの問題を解決するための最も … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

LLavaGuard: VLM-based Safeguards for Vision Dataset Curation and Safety Assessment

投稿日: 2024年6月10日作成者: jarxiv

要約 VLM ベースのセーフガードモデルファミリである LlavaGuard … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

The Expanding Scope of the Stability Gap: Unveiling its Presence in Joint Incremental Learning of Homogeneous Tasks

投稿日: 2024年6月10日作成者: jarxiv

要約最近の研究では、以前に学習したタスクが新しいタスクに移行する際にパフォーマ … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Compositional Curvature Bounds for Deep Neural Networks

投稿日: 2024年6月10日作成者: jarxiv

要約安全性が重要なアプリケーションにおけるニューラルネットワークの広範な使用 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Contextual fusion enhances robustness to image blurring

投稿日: 2024年6月10日作成者: jarxiv

要約哺乳類の脳は、特定の感覚様式に特化した脳領域全体の情報を統合することで、複 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Energy Propagation in Scattering Convolution Networks Can Be Arbitrarily Slow

投稿日: 2024年6月10日作成者: jarxiv

要約マラーのウェーブレット散乱変換などの特徴抽出器として使用される深層畳み込み … 続きを読む →

カテゴリー: (Primary), 42C15, cs.CV, I.4.6, math.FA, secondary | コメントを受け付けていません

Towards Semantic Equivalence of Tokenization in Multimodal LLM

投稿日: 2024年6月10日作成者: jarxiv

要約マルチモーダル大規模言語モデル (MLLM) は、視覚言語タスクの処理にお … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

PatchSVD: A Non-uniform SVD-based Image Compression Algorithm

投稿日: 2024年6月10日作成者: jarxiv

要約データの保存は、画像の解像度が高く複雑であるため、ファイルサイズが大きく … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

DVOS: Self-Supervised Dense-Pattern Video Object Segmentation

投稿日: 2024年6月10日作成者: jarxiv

要約ビデオオブジェクトセグメンテーションのアプローチは、モデル開発のために … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

3D-GRAND: Towards Better Grounding and Less Hallucination for 3D-LLMs

投稿日: 2024年6月10日作成者: jarxiv

要約言語と 3D 認識の統合は、物理世界を理解し、相互作用する身体化されたエー … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

月別アーカイブ: 2024年6月

A Sparse Graph Formulation for Efficient Spectral Image Segmentation

LLavaGuard: VLM-based Safeguards for Vision Dataset Curation and Safety Assessment

The Expanding Scope of the Stability Gap: Unveiling its Presence in Joint Incremental Learning of Homogeneous Tasks

Compositional Curvature Bounds for Deep Neural Networks

Contextual fusion enhances robustness to image blurring

Energy Propagation in Scattering Convolution Networks Can Be Arbitrarily Slow

Towards Semantic Equivalence of Tokenization in Multimodal LLM

PatchSVD: A Non-uniform SVD-based Image Compression Algorithm

DVOS: Self-Supervised Dense-Pattern Video Object Segmentation

3D-GRAND: Towards Better Grounding and Less Hallucination for 3D-LLMs

最近の投稿

最近のコメント

アーカイブ

カテゴリー