-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年9月
A Survey on Benchmarks of Multimodal Large Language Models
要約 マルチモーダル大規模言語モデル (MLLM) は、視覚的な質問応答、視覚的 … 続きを読む
EgoPoser: Robust Real-Time Egocentric Pose Estimation from Sparse and Intermittent Observations Everywhere
要約 頭と手のポーズだけから全身の自己中心的なポーズを推定することは、ヘッドセッ … 続きを読む
GST: Precise 3D Human Body from a Single Image with Gaussian Splatting Transformers
要約 単眼画像からリアルな 3D 人体モデルを再構築することは、クリエイティブ産 … 続きを読む
Introducing Gating and Context into Temporal Action Detection
要約 時間的アクション検出 (TAD) は、トリミングされていないビデオ内のアク … 続きを読む
カテゴリー: cs.CV
Introducing Gating and Context into Temporal Action Detection はコメントを受け付けていません
Learning to Learn Transferable Generative Attack for Person Re-Identification
要約 深層学習ベースの個人再識別 (re-id) モデルは監視システムで広く採用 … 続きを読む
カテゴリー: cs.CV
Learning to Learn Transferable Generative Attack for Person Re-Identification はコメントを受け付けていません
Video alignment using unsupervised learning of local and global features
要約 この論文では、ビデオの位置合わせ、つまり類似のアクションを含む 1 対のビ … 続きを読む
TaskCLIP: Extend Large Vision-Language Model for Task Oriented Object Detection
要約 タスク指向のオブジェクト検出は、特定のタスクを実行するのに適したオブジェク … 続きを読む
カテゴリー: cs.CV
TaskCLIP: Extend Large Vision-Language Model for Task Oriented Object Detection はコメントを受け付けていません
Diagram Formalization Enhanced Multi-Modal Geometry Problem Solver
要約 数学的推論は、AI モデル、特に言語信号と視覚信号の両方を必要とする幾何学 … 続きを読む
カテゴリー: cs.CV
Diagram Formalization Enhanced Multi-Modal Geometry Problem Solver はコメントを受け付けていません
MpoxMamba: A Grouped Mamba-based Lightweight Hybrid Network for Mpox Detection
要約 効果的な mpox 検出ツールの欠如により、mpox ウイルスは世界中で広 … 続きを読む
カテゴリー: cs.CV
MpoxMamba: A Grouped Mamba-based Lightweight Hybrid Network for Mpox Detection はコメントを受け付けていません
UniDet3D: Multi-dataset Indoor 3D Object Detection
要約 ロボティクスや拡張現実におけるスマート ソリューションに対する顧客の需要の … 続きを読む
カテゴリー: cs.CV
UniDet3D: Multi-dataset Indoor 3D Object Detection はコメントを受け付けていません