「cs.LG」カテゴリーアーカイブ

Towards Scalable Insect Monitoring: Ultra-Lightweight CNNs as On-Device Triggers for Insect Camera Traps

投稿日: 2025年2月18日作成者: jarxiv

要約 AIと組み合わせたカメラトラップは、自動化されたスケーラブルな生物多様性監 … 続きを読む →

カテゴリー: cs.CV, cs.LG, eess.IV, q-bio.QM | コメントを受け付けていません

ChordFormer: A Conformer-Based Architecture for Large-Vocabulary Audio Chord Recognition

投稿日: 2025年2月18日作成者: jarxiv

要約コード認識は、音楽分析におけるコードの抽象的で記述的な性質のため、音楽情報 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.IR, cs.LG, cs.SD | コメントを受け付けていません

Steering the LoCoMotif: Using Domain Knowledge in Time Series Motif Discovery

投稿日: 2025年2月18日作成者: jarxiv

要約時系列モチーフディスカバリー（TSMD）は、時系列データの繰り返しパターン … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

iFormer: Integrating ConvNet and Transformer for Mobile Application

投稿日: 2025年2月18日作成者: jarxiv

要約 Iformerと呼ばれるモバイルハイブリッドビジョンネットワークの新しいフ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Bridging Compressed Image Latents and Multimodal Large Language Models

投稿日: 2025年2月18日作成者: jarxiv

要約このホワイトペーパーでは、マルチモーダルの大手言語モデル（MLLM）を採用 … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.MM | コメントを受け付けていません

GRAPHGPT-O: Synergistic Multimodal Comprehension and Generation on Graphs

投稿日: 2025年2月18日作成者: jarxiv

要約マルチモーダル大手言語モデル（MLLMS）の急速な開発により、テキストや画 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Learning Generalizable Prompt for CLIP with Class Similarity Knowledge

投稿日: 2025年2月18日作成者: jarxiv

要約 Vision-Language Models（VLMS）では、迅速なチュー … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Advances in Multimodal Adaptation and Generalization: From Traditional Approaches to Foundation Models

投稿日: 2025年2月18日作成者: jarxiv

要約実際のシナリオでは、モデルが未知のターゲット分布に適応または一般化する必要 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Vision CNNs trained to estimate spatial latents learned similar ventral-stream-aligned representations

投稿日: 2025年2月18日作成者: jarxiv

要約霊長類の腹側視覚河川の機能的役割の研究は、伝統的にオブジェクトの分類に焦点 … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.NE, q-bio.NC | コメントを受け付けていません

Diffusion Models without Classifier-free Guidance

投稿日: 2025年2月18日作成者: jarxiv

要約このホワイトペーパーでは、一般的に使用される分類器のないガイダンス（CFG … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

Towards Scalable Insect Monitoring: Ultra-Lightweight CNNs as On-Device Triggers for Insect Camera Traps

ChordFormer: A Conformer-Based Architecture for Large-Vocabulary Audio Chord Recognition

Steering the LoCoMotif: Using Domain Knowledge in Time Series Motif Discovery

iFormer: Integrating ConvNet and Transformer for Mobile Application

Bridging Compressed Image Latents and Multimodal Large Language Models

GRAPHGPT-O: Synergistic Multimodal Comprehension and Generation on Graphs

Learning Generalizable Prompt for CLIP with Class Similarity Knowledge

Advances in Multimodal Adaptation and Generalization: From Traditional Approaches to Foundation Models

Vision CNNs trained to estimate spatial latents learned similar ventral-stream-aligned representations

Diffusion Models without Classifier-free Guidance

最近の投稿

最近のコメント

アーカイブ

カテゴリー