投稿者「jarxiv」のアーカイブ

COSMOS: Cross-Modality Self-Distillation for Vision Language Pre-training

投稿日: 2025年3月27日作成者: jarxiv

要約対照的な損失で訓練されたビジョン言語モデル（VLM）は、さまざまなビジョン … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Vision as LoRA

投稿日: 2025年3月27日作成者: jarxiv

要約 LLMをMLLMに変換するための新しいパラダイムであるLora（Vora） … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Towards Scalable Foundation Model for Multi-modal and Hyperspectral Geospatial Data

投稿日: 2025年3月27日作成者: jarxiv

要約さまざまな時期やスペクトルバンドで衛星ベースのイメージングシステムによって … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Benchmarking Machine Learning Methods for Distributed Acoustic Sensing

投稿日: 2025年3月27日作成者: jarxiv

要約分散音響センシング（DAS）テクノロジーは、光ファイバーに沿った微小摂動の … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

GLRD: Global-Local Collaborative Reason and Debate with PSL for 3D Open-Vocabulary Detection

投稿日: 2025年3月27日作成者: jarxiv

要約 LIDARベースの3Dオープンボキャブラリー検出（3D OVD）のタスクで … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Flip Learning: Weakly Supervised Erase to Segment Nodules in Breast Ultrasound

投稿日: 2025年3月27日作成者: jarxiv

要約 2D乳房超音波（BUS）と3D自動乳房超音波（ABUS）の両方における結節 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Harmony: A Joint Self-Supervised and Weakly-Supervised Framework for Learning General Purpose Visual Representations

投稿日: 2025年3月27日作成者: jarxiv

要約クリップなどのビジョン言語対照学習フレームワークは、自然言語の監督から学習 … 続きを読む →

カテゴリー: 68T07, 68T45, cs.CV, cs.LG, I.2.10 | コメントを受け付けていません

Data Augmentation in Earth Observation: A Diffusion Model Approach

投稿日: 2025年3月27日作成者: jarxiv

要約高品質の地球観測（EO）画像は、正確な分析とセクター全体で情報に基づいた意 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.SE, I.2.m | コメントを受け付けていません

MMMORRF: Multimodal Multilingual Modularized Reciprocal Rank Fusion

投稿日: 2025年3月27日作成者: jarxiv

要約ビデオには、視覚イベント、テキストオーバーレイ、サウンド、音声など、複数の … 続きを読む →

カテゴリー: cs.CV, cs.IR | コメントを受け付けていません

Networking Systems for Video Anomaly Detection: A Tutorial and Survey

投稿日: 2025年3月27日作成者: jarxiv

要約オンラインビデオアプリケーションの急増と相まって、スマートシティでの監視カ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.CY | コメントを受け付けていません

投稿者「jarxiv」のアーカイブ

COSMOS: Cross-Modality Self-Distillation for Vision Language Pre-training

Vision as LoRA

Towards Scalable Foundation Model for Multi-modal and Hyperspectral Geospatial Data

Benchmarking Machine Learning Methods for Distributed Acoustic Sensing

GLRD: Global-Local Collaborative Reason and Debate with PSL for 3D Open-Vocabulary Detection

Flip Learning: Weakly Supervised Erase to Segment Nodules in Breast Ultrasound

Harmony: A Joint Self-Supervised and Weakly-Supervised Framework for Learning General Purpose Visual Representations

Data Augmentation in Earth Observation: A Diffusion Model Approach

MMMORRF: Multimodal Multilingual Modularized Reciprocal Rank Fusion

Networking Systems for Video Anomaly Detection: A Tutorial and Survey

最近の投稿

最近のコメント

アーカイブ

カテゴリー