月別アーカイブ: 2024年5月

Generating Human Motion in 3D Scenes from Text Descriptions

投稿日: 2024年5月14日作成者: jarxiv

要約テキストの記述から人間の動きを生成することは、その応用範囲が広いため、研究 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

FreeVA: Offline MLLM as Training-Free Video Assistant

投稿日: 2024年5月14日作成者: jarxiv

要約このペーパーでは、マルチモーダル大規模言語モデル (MLLM) の最新の進 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Deep Learning-Based Object Pose Estimation: A Comprehensive Survey

投稿日: 2024年5月14日作成者: jarxiv

要約オブジェクトの姿勢推定は、拡張現実やロボット工学における幅広い用途に関わる … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Guided Interpretable Facial Expression Recognition via Spatial Action Unit Cues

投稿日: 2024年5月14日作成者: jarxiv

要約表情認識 (FER) 用の最先端の分類器は高レベルの精度を達成できますが、 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Localizing Task Information for Improved Model Merging and Compression

投稿日: 2024年5月14日作成者: jarxiv

要約モデルのマージとタスク演算は、複数のシングルタスクチェックポイントを 1 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

NutritionVerse-Direct: Exploring Deep Neural Networks for Multitask Nutrition Prediction from Food Images

投稿日: 2024年5月14日作成者: jarxiv

要約高齢者の多くは、食事摂取量を効果的に追跡することが困難であり、栄養関連の健 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

DP-RDM: Adapting Diffusion Models to Private Domains Without Fine-Tuning

投稿日: 2024年5月14日作成者: jarxiv

要約テキストから画像への拡散モデルはサンプルレベルの記憶に問題があり、トレーニ … 続きを読む →

カテゴリー: cs.CR, cs.CV, cs.LG | コメントを受け付けていません

Automatic Recognition of Food Ingestion Environment from the AIM-2 Wearable Sensor

投稿日: 2024年5月14日作成者: jarxiv

要約摂取環境の検出は、食事摂取量をモニタリングする際の重要な側面です。食事の … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM | コメントを受け付けていません

A Comprehensive Overview of Fish-Eye Camera Distortion Correction Methods

投稿日: 2024年5月14日作成者: jarxiv

要約魚眼カメラは、独特の広い視野などの特徴を持ち、さまざまな分野で幅広く活用さ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Domain Generalisation for Object Detection under Covariate and Concept Shift

投稿日: 2024年5月14日作成者: jarxiv

要約ドメイン一般化は、ドメイン固有の特徴を抑制しながら、ドメイン不変の特徴の学 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2024年5月

Generating Human Motion in 3D Scenes from Text Descriptions

FreeVA: Offline MLLM as Training-Free Video Assistant

Deep Learning-Based Object Pose Estimation: A Comprehensive Survey

Guided Interpretable Facial Expression Recognition via Spatial Action Unit Cues

Localizing Task Information for Improved Model Merging and Compression

NutritionVerse-Direct: Exploring Deep Neural Networks for Multitask Nutrition Prediction from Food Images

DP-RDM: Adapting Diffusion Models to Private Domains Without Fine-Tuning

Automatic Recognition of Food Ingestion Environment from the AIM-2 Wearable Sensor

A Comprehensive Overview of Fish-Eye Camera Distortion Correction Methods

Domain Generalisation for Object Detection under Covariate and Concept Shift

最近の投稿

最近のコメント

アーカイブ

カテゴリー