「cs.LG」カテゴリーアーカイブ

Coverage-Constrained Human-AI Cooperation with Multiple Experts

投稿日: 2024年12月5日作成者: jarxiv

要約人間とAIの協調的分類（HAI-CC）アプローチは、人間の専門知識とAIの … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

A Bidirectional Siamese Recurrent Neural Network for Accurate Gait Recognition Using Body Landmarks

投稿日: 2024年12月5日作成者: jarxiv

要約歩行認識は、特に他の生理学的バイオメトリクスが実用的でない、あるいは有効で … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

KKLIP: Knowledge Distillation Exploiting K-means Clustering for Language-Image Pre-Training

投稿日: 2024年12月5日作成者: jarxiv

要約近年、CLIPは、マルチモーダルなシナリオにおいて画像とテキスト情報を整合 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Instance-Warp: Saliency Guided Image Warping for Unsupervised Domain Adaptation

投稿日: 2024年12月5日作成者: jarxiv

要約夜間、雨、雪などの条件下での運転は難しい。良いラベル付きデータセットがない … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Perception Tokens Enhance Visual Reasoning in Multimodal Language Models

投稿日: 2024年12月5日作成者: jarxiv

要約マルチモーダル言語モデル(MLM)は、特殊なモデルが得意とする基本的な視覚 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Navigation World Models

投稿日: 2024年12月5日作成者: jarxiv

要約ナビゲーションは、視覚運動能力を持つエージェントの基本的なスキルである。我 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Yo’LLaVA: Your Personalized Language and Vision Assistant

投稿日: 2024年12月5日作成者: jarxiv

要約大規模マルチモーダルモデル(LMM)は、様々なタスク(例：画像キャプション … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Fast and reliable uncertainty quantification with neural network ensembles for industrial image classification

投稿日: 2024年12月5日作成者: jarxiv

要約ニューラルネットワーク(NN)による画像分類は産業プロセスで広く使用されて … 続きを読む →

カテゴリー: cs.LG, stat.ML | コメントを受け付けていません

On Privacy, Security, and Trustworthiness in Distributed Wireless Large AI Models (WLAM)

投稿日: 2024年12月5日作成者: jarxiv

要約無線通信と大型人工知能（AI）モデルを組み合わせることで、無数の新規アプリ … 続きを読む →

カテゴリー: cs.IT, cs.LG, eess.SP, math.IT | コメントを受け付けていません

Learning Ensembles of Vision-based Safety Control Filters

投稿日: 2024年12月4日作成者: jarxiv

要約制御システムにおける安全フィルタは、安全制約に違反する公称制御を修正する。 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO, cs.SY, eess.SY | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

Coverage-Constrained Human-AI Cooperation with Multiple Experts

A Bidirectional Siamese Recurrent Neural Network for Accurate Gait Recognition Using Body Landmarks

KKLIP: Knowledge Distillation Exploiting K-means Clustering for Language-Image Pre-Training

Instance-Warp: Saliency Guided Image Warping for Unsupervised Domain Adaptation

Perception Tokens Enhance Visual Reasoning in Multimodal Language Models

Navigation World Models

Yo’LLaVA: Your Personalized Language and Vision Assistant

Fast and reliable uncertainty quantification with neural network ensembles for industrial image classification

On Privacy, Security, and Trustworthiness in Distributed Wireless Large AI Models (WLAM)

Learning Ensembles of Vision-based Safety Control Filters

最近の投稿

最近のコメント

アーカイブ

カテゴリー