月別アーカイブ: 2024年6月

MIM-Refiner: A Contrastive Learning Boost from Intermediate Pre-Trained Representations

投稿日: 2024年6月4日作成者: jarxiv

要約我々はMIM(Masked Image Modeling)-Refiner … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Mitigating Motion Blur in Neural Radiance Fields with Events and Frames

投稿日: 2024年6月4日作成者: jarxiv

要約 Neural Radiance Fields (NeRF)は、新しいビュー … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

GIFT: Generative Interpretable Fine-Tuning

投稿日: 2024年6月4日作成者: jarxiv

要約これは、パラメータ空間あるいは活性化空間における単純な因数分解行列乗算とし … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Graph External Attention Enhanced Transformer

投稿日: 2024年6月4日作成者: jarxiv

要約 Transformerアーキテクチャは、カスタマイズされた注意メカニズムや … 続きを読む →

カテゴリー: cs.LG | コメントを受け付けていません

Large Language Models are Zero-Shot Next Location Predictors

投稿日: 2024年6月4日作成者: jarxiv

要約ある個人が将来訪れる場所を予測することは、病気の拡散や公害の削減など、多く … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CY | コメントを受け付けていません

A Pixel Is Worth More Than One 3D Gaussians in Single-View 3D Reconstruction

投稿日: 2024年6月4日作成者: jarxiv

要約単視点画像から3Dシーン表現を学習することは、コンピュータビジョンにおける … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Fusion-PSRO: Nash Policy Fusion for Policy Space Response Oracles

投稿日: 2024年6月4日作成者: jarxiv

要約ゼロサムゲームを解くための一般的なアプローチは、ナッシュ均衡(NE)を近似 … 続きを読む →

カテゴリー: cs.AI, cs.GT, cs.LG, cs.MA | コメントを受け付けていません

S4Fusion: Saliency-aware Selective State Space Model for Infrared Visible Image Fusion

投稿日: 2024年6月4日作成者: jarxiv

要約画像融合におけるタスクの1つとして、赤外線画像と可視画像の融合は、異なるモ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

StrucTexTv3: An Efficient Vision-Language Model for Text-rich Image Perception, Comprehension, and Beyond

投稿日: 2024年6月4日作成者: jarxiv

要約テキストリッチな画像は、人間生活の様々な場面に深く溶け込み、重要かつ広範な … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

SOUL: Unlocking the Power of Second-Order Optimization for LLM Unlearning

投稿日: 2024年6月4日作成者: jarxiv

要約大規模言語モデル(LLM)は、データ規制と倫理的なAIの実践を遵守するため … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

月別アーカイブ: 2024年6月

MIM-Refiner: A Contrastive Learning Boost from Intermediate Pre-Trained Representations

Mitigating Motion Blur in Neural Radiance Fields with Events and Frames

GIFT: Generative Interpretable Fine-Tuning

Graph External Attention Enhanced Transformer

Large Language Models are Zero-Shot Next Location Predictors

A Pixel Is Worth More Than One 3D Gaussians in Single-View 3D Reconstruction

Fusion-PSRO: Nash Policy Fusion for Policy Space Response Oracles

S4Fusion: Saliency-aware Selective State Space Model for Infrared Visible Image Fusion

StrucTexTv3: An Efficient Vision-Language Model for Text-rich Image Perception, Comprehension, and Beyond

SOUL: Unlocking the Power of Second-Order Optimization for LLM Unlearning

最近の投稿

最近のコメント

アーカイブ

カテゴリー