「cs.MM」カテゴリーアーカイブ

Towards Garment Sewing Pattern Reconstruction from a Single Image

投稿日: 2023年11月8日作成者: jarxiv

要約衣服の縫製パターンは衣服の本質的な残りの形状を表し、ファッションデザイン … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG, cs.MM | コメントを受け付けていません

Out-of-distribution Detection Learning with Unreliable Out-of-distribution Sources

投稿日: 2023年11月7日作成者: jarxiv

要約分布外 (OOD) 検出は、予測子が有効な予測を行うことができない OOD … 続きを読む →

カテゴリー: cs.LG, cs.MM | コメントを受け付けていません

Leveraging Automatic Personalised Nutrition: Food Image Recognition Benchmark and Dataset based on Nutrition Taxonomy

投稿日: 2023年11月3日作成者: jarxiv

要約不適切な食生活が特徴的な今日の座りっぱなしの社会では、健康的なライフスタイ … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

GlueGen: Plug and Play Multi-modal Encoders for X-to-image Generation

投稿日: 2023年11月3日作成者: jarxiv

要約拡散プロセスに基づくテキストから画像への (T2I) モデルは、ユーザーが … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

LLaVA-Interactive: An All-in-One Demo for Image Chat, Segmentation, Generation and Editing

投稿日: 2023年11月2日作成者: jarxiv

要約 LLaVA-Interactive は、マルチモーダルな人間と AI のイ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.HC, cs.MM | コメントを受け付けていません

A Transformer-Based Model With Self-Distillation for Multimodal Emotion Recognition in Conversations

投稿日: 2023年11月1日作成者: jarxiv

要約会話における感情認識 (ERC) は、会話中の各発話の感情を認識するタスク … 続きを読む →

カテゴリー: cs.AI, cs.MM | コメントを受け付けていません

Large-scale Multi-Modal Pre-trained Models: A Comprehensive Survey

投稿日: 2023年11月1日作成者: jarxiv

要約一般化されたディープモデルに対する緊急の需要に伴い、BERT、ViT、G … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM | コメントを受け付けていません

AMPose: Alternately Mixed Global-Local Attention Model for 3D Human Pose Estimation

投稿日: 2023年11月1日作成者: jarxiv

要約グラフ畳み込みネットワーク (GCN) は、3D 人間姿勢推定 (HPE) … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

LAVSS: Location-Guided Audio-Visual Spatial Audio Separation

投稿日: 2023年11月1日作成者: jarxiv

要約既存の機械学習研究は、モノラル視聴覚分離 (MAVS) において有望な結果 … 続きを読む →

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

Multi-body SE(3) Equivariance for Unsupervised Rigid Segmentation and Motion Estimation

投稿日: 2023年11月1日作成者: jarxiv

要約剛体セグメンテーションと動き推定に対する真に一般化可能なアプローチは、関節 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | コメントを受け付けていません

「cs.MM」カテゴリーアーカイブ

Towards Garment Sewing Pattern Reconstruction from a Single Image

Out-of-distribution Detection Learning with Unreliable Out-of-distribution Sources

Leveraging Automatic Personalised Nutrition: Food Image Recognition Benchmark and Dataset based on Nutrition Taxonomy

GlueGen: Plug and Play Multi-modal Encoders for X-to-image Generation

LLaVA-Interactive: An All-in-One Demo for Image Chat, Segmentation, Generation and Editing

A Transformer-Based Model With Self-Distillation for Multimodal Emotion Recognition in Conversations

Large-scale Multi-Modal Pre-trained Models: A Comprehensive Survey

AMPose: Alternately Mixed Global-Local Attention Model for 3D Human Pose Estimation

LAVSS: Location-Guided Audio-Visual Spatial Audio Separation

Multi-body SE(3) Equivariance for Unsupervised Rigid Segmentation and Motion Estimation

最近の投稿

最近のコメント

アーカイブ

カテゴリー