cs.LG」カテゴリーアーカイブ

Coverage-Constrained Human-AI Cooperation with Multiple Experts

要約 人間とAIの協調的分類(HAI-CC)アプローチは、人間の専門知識とAIの … 続きを読む

カテゴリー: cs.CV, cs.LG | Coverage-Constrained Human-AI Cooperation with Multiple Experts はコメントを受け付けていません

A Bidirectional Siamese Recurrent Neural Network for Accurate Gait Recognition Using Body Landmarks

要約 歩行認識は、特に他の生理学的バイオメトリクスが実用的でない、あるいは有効で … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | A Bidirectional Siamese Recurrent Neural Network for Accurate Gait Recognition Using Body Landmarks はコメントを受け付けていません

KKLIP: Knowledge Distillation Exploiting K-means Clustering for Language-Image Pre-Training

要約 近年、CLIPは、マルチモーダルなシナリオにおいて画像とテキスト情報を整合 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | KKLIP: Knowledge Distillation Exploiting K-means Clustering for Language-Image Pre-Training はコメントを受け付けていません

Instance-Warp: Saliency Guided Image Warping for Unsupervised Domain Adaptation

要約 夜間、雨、雪などの条件下での運転は難しい。良いラベル付きデータセットがない … 続きを読む

カテゴリー: cs.CV, cs.LG | Instance-Warp: Saliency Guided Image Warping for Unsupervised Domain Adaptation はコメントを受け付けていません

Perception Tokens Enhance Visual Reasoning in Multimodal Language Models

要約 マルチモーダル言語モデル(MLM)は、特殊なモデルが得意とする基本的な視覚 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Perception Tokens Enhance Visual Reasoning in Multimodal Language Models はコメントを受け付けていません

Navigation World Models

要約 ナビゲーションは、視覚運動能力を持つエージェントの基本的なスキルである。我 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Navigation World Models はコメントを受け付けていません

Yo’LLaVA: Your Personalized Language and Vision Assistant

要約 大規模マルチモーダルモデル(LMM)は、様々なタスク(例:画像キャプション … 続きを読む

カテゴリー: cs.CV, cs.LG | Yo’LLaVA: Your Personalized Language and Vision Assistant はコメントを受け付けていません

Fast and reliable uncertainty quantification with neural network ensembles for industrial image classification

要約 ニューラルネットワーク(NN)による画像分類は産業プロセスで広く使用されて … 続きを読む

カテゴリー: cs.LG, stat.ML | Fast and reliable uncertainty quantification with neural network ensembles for industrial image classification はコメントを受け付けていません

On Privacy, Security, and Trustworthiness in Distributed Wireless Large AI Models (WLAM)

要約 無線通信と大型人工知能(AI)モデルを組み合わせることで、無数の新規アプリ … 続きを読む

カテゴリー: cs.IT, cs.LG, eess.SP, math.IT | On Privacy, Security, and Trustworthiness in Distributed Wireless Large AI Models (WLAM) はコメントを受け付けていません

Learning Ensembles of Vision-based Safety Control Filters

要約 制御システムにおける安全フィルタは、安全制約に違反する公称制御を修正する。 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO, cs.SY, eess.SY | Learning Ensembles of Vision-based Safety Control Filters はコメントを受け付けていません