-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年8月
Edit As You Wish: Video Caption Editing with Multi-grained User Control
要約 ユーザーのリクエストに応じて自然言語でビデオを自動的にナレーションすること … 続きを読む
Enhancing Journalism with AI: A Study of Contextualized Image Captioning for News Articles using LLMs and LMMs
要約 大規模言語モデル (LLM) と大規模マルチモーダル モデル (LMM) … 続きを読む
HARMamba: Efficient and Lightweight Wearable Sensor Human Activity Recognition Based on Bidirectional Mamba
要約 ウェアラブル センサー ベースの人間活動認識 (HAR) は、活動認識にお … 続きを読む
Fast and Accurate Object Detection on Asymmetrical Receptive Field
要約 物体検出は幅広い業界で使用されています。 たとえば、自動運転における物体検 … 続きを読む
カテゴリー: cs.CV
Fast and Accurate Object Detection on Asymmetrical Receptive Field はコメントを受け付けていません
Self-supervised visual learning from interactions with objects
要約 自己教師あり学習 (SSL) は視覚表現学習に革命をもたらしましたが、人間 … 続きを読む
AggSS: An Aggregated Self-Supervised Approach for Class-Incremental Learning
要約 この論文では、自己教師あり学習、特に画像の回転がさまざまなクラス増分学習パ … 続きを読む
カテゴリー: cs.CV
AggSS: An Aggregated Self-Supervised Approach for Class-Incremental Learning はコメントを受け付けていません
Detecting Car Speed using Object Detection and Depth Estimation: A Deep Learning Framework
要約 交通事故は世界のほぼすべての地域で非常に頻繁に発生しており、死亡事故の大多 … 続きを読む
MultiViPerFrOG: A Globally Optimized Multi-Viewpoint Perception Framework for Camera Motion and Tissue Deformation
要約 移動深度カメラによって捕捉された情報から変形可能な環境の 3D 形状を再構 … 続きを読む
カテゴリー: cs.CV
MultiViPerFrOG: A Globally Optimized Multi-Viewpoint Perception Framework for Camera Motion and Tissue Deformation はコメントを受け付けていません
GenAD: Generalized Predictive Model for Autonomous Driving
要約 この論文では、自動運転分野における初の大規模ビデオ予測モデルを紹介します。 … 続きを読む
カテゴリー: cs.CV
GenAD: Generalized Predictive Model for Autonomous Driving はコメントを受け付けていません
P2LHAP:Wearable sensor-based human activity recognition, segmentation and forecast through Patch-to-Label Seq2Seq Transformer
要約 従来の深層学習手法では、センサー データから人間の活動を同時にセグメント化 … 続きを読む