cs.LG」カテゴリーアーカイブ

Towards Scalable Insect Monitoring: Ultra-Lightweight CNNs as On-Device Triggers for Insect Camera Traps

要約 AIと組み合わせたカメラトラップは、自動化されたスケーラブルな生物多様性監 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV, q-bio.QM | Towards Scalable Insect Monitoring: Ultra-Lightweight CNNs as On-Device Triggers for Insect Camera Traps はコメントを受け付けていません

ChordFormer: A Conformer-Based Architecture for Large-Vocabulary Audio Chord Recognition

要約 コード認識は、音楽分析におけるコードの抽象的で記述的な性質のため、音楽情報 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.IR, cs.LG, cs.SD | ChordFormer: A Conformer-Based Architecture for Large-Vocabulary Audio Chord Recognition はコメントを受け付けていません

Steering the LoCoMotif: Using Domain Knowledge in Time Series Motif Discovery

要約 時系列モチーフディスカバリー(TSMD)は、時系列データの繰り返しパターン … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Steering the LoCoMotif: Using Domain Knowledge in Time Series Motif Discovery はコメントを受け付けていません

iFormer: Integrating ConvNet and Transformer for Mobile Application

要約 Iformerと呼ばれるモバイルハイブリッドビジョンネットワークの新しいフ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | iFormer: Integrating ConvNet and Transformer for Mobile Application はコメントを受け付けていません

Bridging Compressed Image Latents and Multimodal Large Language Models

要約 このホワイトペーパーでは、マルチモーダルの大手言語モデル(MLLM)を採用 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.MM | Bridging Compressed Image Latents and Multimodal Large Language Models はコメントを受け付けていません

GRAPHGPT-O: Synergistic Multimodal Comprehension and Generation on Graphs

要約 マルチモーダル大手言語モデル(MLLMS)の急速な開発により、テキストや画 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | GRAPHGPT-O: Synergistic Multimodal Comprehension and Generation on Graphs はコメントを受け付けていません

Learning Generalizable Prompt for CLIP with Class Similarity Knowledge

要約 Vision-Language Models(VLMS)では、迅速なチュー … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Learning Generalizable Prompt for CLIP with Class Similarity Knowledge はコメントを受け付けていません

Advances in Multimodal Adaptation and Generalization: From Traditional Approaches to Foundation Models

要約 実際のシナリオでは、モデルが未知のターゲット分布に適応または一般化する必要 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Advances in Multimodal Adaptation and Generalization: From Traditional Approaches to Foundation Models はコメントを受け付けていません

Vision CNNs trained to estimate spatial latents learned similar ventral-stream-aligned representations

要約 霊長類の腹側視覚河川の機能的役割の研究は、伝統的にオブジェクトの分類に焦点 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.NE, q-bio.NC | Vision CNNs trained to estimate spatial latents learned similar ventral-stream-aligned representations はコメントを受け付けていません

Diffusion Models without Classifier-free Guidance

要約 このホワイトペーパーでは、一般的に使用される分類器のないガイダンス(CFG … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Diffusion Models without Classifier-free Guidance はコメントを受け付けていません