cs.AI」カテゴリーアーカイブ

A Closer Look at Data Augmentation Strategies for Finetuning-Based Low/Few-Shot Object Detection

要約 低ショットおよび少数ショットの物体検出のための現在の方法は、主に物体を検出 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.PF | A Closer Look at Data Augmentation Strategies for Finetuning-Based Low/Few-Shot Object Detection はコメントを受け付けていません

Self-Supervised Disentanglement by Leveraging Structure in Data Augmentations

要約 自己教師あり表現学習では、多くの場合、データ拡張を使用して、データの「スタ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, stat.ML | Self-Supervised Disentanglement by Leveraging Structure in Data Augmentations はコメントを受け付けていません

HiRED: Attention-Guided Token Dropping for Efficient Inference of High-Resolution Vision-Language Models in Resource-Constrained Environments

要約 高解像度の視覚言語モデル (VLM) は、詳細な画像情報を保存することで精 … 続きを読む

カテゴリー: cs.AI, cs.CV | HiRED: Attention-Guided Token Dropping for Efficient Inference of High-Resolution Vision-Language Models in Resource-Constrained Environments はコメントを受け付けていません

Denoising Plane Wave Ultrasound Images Using Diffusion Probabilistic Models

要約 超音波平面波イメージングは​​、高フレームレートのイメージングを可能にする … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | Denoising Plane Wave Ultrasound Images Using Diffusion Probabilistic Models はコメントを受け付けていません

Efficient and Robust Quantization-aware Training via Adaptive Coreset Selection

要約 量子化対応トレーニング (QAT) は、重みとアクティベーションの冗長性を … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Efficient and Robust Quantization-aware Training via Adaptive Coreset Selection はコメントを受け付けていません

Transfusion: Predict the Next Token and Diffuse Images with One Multi-Modal Model

要約 離散データと連続データに対してマルチモーダル モデルをトレーニングするため … 続きを読む

カテゴリー: cs.AI, cs.CV | Transfusion: Predict the Next Token and Diffuse Images with One Multi-Modal Model はコメントを受け付けていません

Unified Domain Adaptive Semantic Segmentation

要約 監視なしドメイン適応型セマンティック セグメンテーション (UDA-SS) … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | Unified Domain Adaptive Semantic Segmentation はコメントを受け付けていません

FLAME: Learning to Navigate with Multimodal LLM in Urban Environments

要約 大規模言語モデル (LLM) は、視覚と言語のナビゲーション (VLN) … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.RO | FLAME: Learning to Navigate with Multimodal LLM in Urban Environments はコメントを受け付けていません

NeCo: Improving DINOv2’s spatial representations in 19 GPU hours with Patch Neighbor Consistency

要約 事前トレーニングされた表現を改善するための新しい自己教師あり学習信号として … 続きを読む

カテゴリー: cs.AI, cs.CV | NeCo: Improving DINOv2’s spatial representations in 19 GPU hours with Patch Neighbor Consistency はコメントを受け付けていません

PLUTUS: A Well Pre-trained Large Unified Transformer can Unveil Financial Time Series Regularities

要約 金融時系列モデリングは市場の動きを理解して予測するために重要ですが、非線形 … 続きを読む

カテゴリー: cs.AI, cs.LG | PLUTUS: A Well Pre-trained Large Unified Transformer can Unveil Financial Time Series Regularities はコメントを受け付けていません