月別アーカイブ: 2024年1月

Distribution Matching for Multi-Task Learning of Classification Tasks: a Large-Scale Study on Faces & Beyond

要約 マルチタスク学習 (MTL) は、複数の関連タスクが共同で学習され、共有表 … 続きを読む

カテゴリー: cs.CV | Distribution Matching for Multi-Task Learning of Classification Tasks: a Large-Scale Study on Faces & Beyond はコメントを受け付けていません

Exploiting Causality Signals in Medical Images: A Pilot Study with Empirical Results

要約 我々は、分類目的でニューラルネットワークを介して画像から弱い因果信号を直接 … 続きを読む

カテゴリー: cs.AI, cs.CV, I.2.6 | Exploiting Causality Signals in Medical Images: A Pilot Study with Empirical Results はコメントを受け付けていません

PointDC:Unsupervised Semantic Segmentation of 3D Point Clouds via Cross-modal Distillation and Super-Voxel Clustering

要約 点群のセマンティック セグメンテーションには、通常、人間による注釈の骨の折 … 続きを読む

カテゴリー: cs.CV | PointDC:Unsupervised Semantic Segmentation of 3D Point Clouds via Cross-modal Distillation and Super-Voxel Clustering はコメントを受け付けていません

IdentiFace : A VGG Based Multimodal Facial Biometric System

要約 顔生体認証システムの開発は、コンピュータ ビジョン分野の発展に大きく貢献し … 続きを読む

カテゴリー: cs.AI, cs.CV | IdentiFace : A VGG Based Multimodal Facial Biometric System はコメントを受け付けていません

Data-Efficient Multimodal Fusion on a Single GPU

要約 マルチモーダル アライメントの目標は、マルチモーダル入力間で共有される単一 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Data-Efficient Multimodal Fusion on a Single GPU はコメントを受け付けていません

Temporal Adaptive RGBT Tracking with Modality Prompt

要約 RGBT トラッキングは、ロボット工学、監視処理、自動運転などのさまざまな … 続きを読む

カテゴリー: cs.CV | Temporal Adaptive RGBT Tracking with Modality Prompt はコメントを受け付けていません

Deep Learning-Based Computational Model for Disease Identification in Cocoa Pods (Theobroma cacao L.)

要約 カカオの実の病気を早期に特定することは、高品質のカカオの生産を保証するため … 続きを読む

カテゴリー: cs.CV | Deep Learning-Based Computational Model for Disease Identification in Cocoa Pods (Theobroma cacao L.) はコメントを受け付けていません

ArtGPT-4: Towards Artistic-understanding Large Vision-Language Models with Enhanced Adapter

要約 近年、大規模言語モデルの進歩は目覚ましく、ChatGPT などのモデルはさ … 続きを読む

カテゴリー: cs.CL, cs.CV | ArtGPT-4: Towards Artistic-understanding Large Vision-Language Models with Enhanced Adapter はコメントを受け付けていません

Recovering 3D Human Mesh from Monocular Images: A Survey

要約 単眼画像から人間の姿勢や形状を推定することは、コンピューター ビジョンにお … 続きを読む

カテゴリー: cs.CV, cs.GR | Recovering 3D Human Mesh from Monocular Images: A Survey はコメントを受け付けていません

VideoDrafter: Content-Consistent Multi-Scene Video Generation with LLM

要約 拡散モデルにおける最近の技術革新と画期的な進歩により、指定されたプロンプト … 続きを読む

カテゴリー: cs.CL, cs.CV | VideoDrafter: Content-Consistent Multi-Scene Video Generation with LLM はコメントを受け付けていません