月別アーカイブ: 2024年5月

Generating Human Motion in 3D Scenes from Text Descriptions

要約 テキストの記述から人間の動きを生成することは、その応用範囲が広いため、研究 … 続きを読む

カテゴリー: cs.CV | Generating Human Motion in 3D Scenes from Text Descriptions はコメントを受け付けていません

FreeVA: Offline MLLM as Training-Free Video Assistant

要約 このペーパーでは、マルチモーダル大規模言語モデル (MLLM) の最新の進 … 続きを読む

カテゴリー: cs.AI, cs.CV | FreeVA: Offline MLLM as Training-Free Video Assistant はコメントを受け付けていません

Deep Learning-Based Object Pose Estimation: A Comprehensive Survey

要約 オブジェクトの姿勢推定は、拡張現実やロボット工学における幅広い用途に関わる … 続きを読む

カテゴリー: cs.CV | Deep Learning-Based Object Pose Estimation: A Comprehensive Survey はコメントを受け付けていません

Guided Interpretable Facial Expression Recognition via Spatial Action Unit Cues

要約 表情認識 (FER) 用の最先端の分類器は高レベルの精度を達成できますが、 … 続きを読む

カテゴリー: cs.CV | Guided Interpretable Facial Expression Recognition via Spatial Action Unit Cues はコメントを受け付けていません

Localizing Task Information for Improved Model Merging and Compression

要約 モデルのマージとタスク演算は、複数のシングルタスク チェックポイントを 1 … 続きを読む

カテゴリー: cs.CV, cs.LG | Localizing Task Information for Improved Model Merging and Compression はコメントを受け付けていません

NutritionVerse-Direct: Exploring Deep Neural Networks for Multitask Nutrition Prediction from Food Images

要約 高齢者の多くは、食事摂取量を効果的に追跡することが困難であり、栄養関連の健 … 続きを読む

カテゴリー: cs.CV | NutritionVerse-Direct: Exploring Deep Neural Networks for Multitask Nutrition Prediction from Food Images はコメントを受け付けていません

DP-RDM: Adapting Diffusion Models to Private Domains Without Fine-Tuning

要約 テキストから画像への拡散モデルはサンプルレベルの記憶に問題があり、トレーニ … 続きを読む

カテゴリー: cs.CR, cs.CV, cs.LG | DP-RDM: Adapting Diffusion Models to Private Domains Without Fine-Tuning はコメントを受け付けていません

Automatic Recognition of Food Ingestion Environment from the AIM-2 Wearable Sensor

要約 摂取環境の検出は、食事摂取量をモニタリングする際の重要な側面です。 食事の … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | Automatic Recognition of Food Ingestion Environment from the AIM-2 Wearable Sensor はコメントを受け付けていません

A Comprehensive Overview of Fish-Eye Camera Distortion Correction Methods

要約 魚眼カメラは、独特の広い視野などの特徴を持ち、さまざまな分野で幅広く活用さ … 続きを読む

カテゴリー: cs.CV | A Comprehensive Overview of Fish-Eye Camera Distortion Correction Methods はコメントを受け付けていません

Domain Generalisation for Object Detection under Covariate and Concept Shift

要約 ドメイン一般化は、ドメイン固有の特徴を抑制しながら、ドメイン不変の特徴の学 … 続きを読む

カテゴリー: cs.CV | Domain Generalisation for Object Detection under Covariate and Concept Shift はコメントを受け付けていません