cs.LG」カテゴリーアーカイブ

Speak Easy: Eliciting Harmful Jailbreaks from LLMs with Simple Interactions

要約 広範な安全整合の取り組みにもかかわらず、大規模な言語モデル(LLM)は、有 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CY, cs.LG | Speak Easy: Eliciting Harmful Jailbreaks from LLMs with Simple Interactions はコメントを受け付けていません

MuJo: Multimodal Joint Feature Space Learning for Human Activity Recognition

要約 人間の活動認識(HAR)は、ヘルスケア、スポーツ、フィットネス、セキュリテ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | MuJo: Multimodal Joint Feature Space Learning for Human Activity Recognition はコメントを受け付けていません

A Survey of Artificial Intelligence in Gait-Based Neurodegenerative Disease Diagnosis

要約 近年、神経変性疾患(NDS)の影響を受ける世界集団の増加が目撃されました。 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | A Survey of Artificial Intelligence in Gait-Based Neurodegenerative Disease Diagnosis はコメントを受け付けていません

DEALing with Image Reconstruction: Deep Attentive Least Squares

要約 最先端の画像再構成は、多くの場合、複雑で高度にパラメーター化された深いアー … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | DEALing with Image Reconstruction: Deep Attentive Least Squares はコメントを受け付けていません

Evaluating Numerical Reasoning in Text-to-Image Models

要約 テキストから画像への生成モデルは、自然言語を使用して記述されている概念を忠 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | Evaluating Numerical Reasoning in Text-to-Image Models はコメントを受け付けていません

Generative Adversarial Networks Bridging Art and Machine Intelligence

要約 この本は、GANの基本原則と歴史的発展の詳細な紹介から始まり、伝統的な生成 … 続きを読む

カテゴリー: cs.CV, cs.LG | Generative Adversarial Networks Bridging Art and Machine Intelligence はコメントを受け付けていません

Keep It Light! Simplifying Image Clustering Via Text-Free Adapters

要約 多くの競争力のあるクラスタリングパイプラインには、マルチモーダル設計があり … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.NE, stat.CO, stat.ML | Keep It Light! Simplifying Image Clustering Via Text-Free Adapters はコメントを受け付けていません

VideoSAM: A Large Vision Foundation Model for High-Speed Video Segmentation

要約 高速ビデオ(HSV)セグメンテーションは、熱伝達などの科学的および産業用途 … 続きを読む

カテゴリー: cs.CV, cs.LG | VideoSAM: A Large Vision Foundation Model for High-Speed Video Segmentation はコメントを受け付けていません

Cross the Gap: Exposing the Intra-modal Misalignment in CLIP via Modality Inversion

要約 クリップのような事前に訓練されたマルチモーダルビジョン言語モデルは、さまざ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Cross the Gap: Exposing the Intra-modal Misalignment in CLIP via Modality Inversion はコメントを受け付けていません

Learning Real-World Action-Video Dynamics with Heterogeneous Masked Autoregression

要約 アクションとビデオのダイナミクスをモデリングするための不均一なマスク自己網 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Learning Real-World Action-Video Dynamics with Heterogeneous Masked Autoregression はコメントを受け付けていません