-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年7月
3D Human Mesh Estimation from Virtual Markers
要約 体積測定による 3D 姿勢推定の成功に触発されて、一部の最近のヒューマン … 続きを読む
カテゴリー: cs.CV
3D Human Mesh Estimation from Virtual Markers はコメントを受け付けていません
RoadFormer: Duplex Transformer for RGB-Normal Semantic Road Scene Parsing
要約 ディープ畳み込みニューラル ネットワークの最近の進歩は、道路シーンの解析の … 続きを読む
VTG-LLM: Integrating Timestamp Knowledge into Video LLMs for Enhanced Video Temporal Grounding
要約 Video Temporal Grounding(VTG)は、言語クエリに … 続きを読む
カテゴリー: cs.CV
VTG-LLM: Integrating Timestamp Knowledge into Video LLMs for Enhanced Video Temporal Grounding はコメントを受け付けていません
A Simple Framework for Open-Vocabulary Zero-Shot Segmentation
要約 ゼロショット分類機能は、視覚言語の対照的なフレームワーク内でトレーニングさ … 続きを読む
カテゴリー: cs.CV
A Simple Framework for Open-Vocabulary Zero-Shot Segmentation はコメントを受け付けていません
YOLOv10 to Its Genesis: A Decadal and Comprehensive Review of The You Only Look Once Series
要約 このレビューでは、YOLOv1 から最近発表された YOLOv10 までの … 続きを読む
カテゴリー: cs.CV
YOLOv10 to Its Genesis: A Decadal and Comprehensive Review of The You Only Look Once Series はコメントを受け付けていません
Training morphological neural networks with gradient descent: some theoretical insights
要約 形態学的ニューラル ネットワーク (レイヤー) は、完全な格子演算子の表現 … 続きを読む
VIPriors 4: Visual Inductive Priors for Data-Efficient Deep Learning Challenges
要約 「VIPriors: データ効率の高い深層学習のための視覚的帰納的事前分布 … 続きを読む
カテゴリー: cs.CV
VIPriors 4: Visual Inductive Priors for Data-Efficient Deep Learning Challenges はコメントを受け付けていません
E-ANT: A Large-Scale Dataset for Efficient Automatic GUI NavigaTion
要約 モバイル デバイス上のオンライン GUI ナビゲーションは、多くの実世界の … 続きを読む
DynamicGlue: Epipolar and Time-Informed Data Association in Dynamic Environments using Graph Neural Networks
要約 静的環境の想定は、SLAM などの多くの幾何学的なコンピューター ビジョン … 続きを読む
PosterLLaVa: Constructing a Unified Multi-modal Layout Generator with LLM
要約 レイアウト生成は、自動グラフィック デザインを実現するための要であり、さま … 続きを読む
カテゴリー: cs.CV
PosterLLaVa: Constructing a Unified Multi-modal Layout Generator with LLM はコメントを受け付けていません