-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年2月
Enhancing Vehicle Make and Model Recognition with 3D Attention Modules
要約 車両の製造およびモデル認識(VMMR)は、インテリジェント輸送システムの重 … 続きを読む
Generative Video Diffusion for Unseen Novel Semantic Video Moment Retrieval
要約 ビデオモーメント検索(VMR)は、非トリムビデオのテキストクエリに対応する … 続きを読む
カテゴリー: cs.CV
Generative Video Diffusion for Unseen Novel Semantic Video Moment Retrieval はコメントを受け付けていません
Evaluating Multimodal Generative AI with Korean Educational Standards
要約 このペーパーでは、韓国の国家教育テストを使用してマルチモーダル生成AIシス … 続きを読む
Anatomy-Informed Deep Learning and Radiomics for Automated Neurofibroma Segmentation in Whole-Body MRI
要約 神経線維腫症1型は、神経線維腫(NFS)の発症を特徴とする遺伝的障害であり … 続きを読む
LaRE$^2$: Latent Reconstruction Error Based Method for Diffusion-Generated Image Detection
要約 拡散モデルの進化により、画像生成の品質が劇的に向上し、実際の画像と生成され … 続きを読む
HeRCULES: Heterogeneous Radar Dataset in Complex Urban Environment for Multi-session Radar SLAM
要約 最近、レーダーは、挑戦的な気象条件での堅牢性のためにロボット工学で広く掲載 … 続きを読む
LEAP: Enhancing Vision-Based Occupancy Networks with Lightweight Spatio-Temporal Correlation
要約 ビジョンベースの占有ネットワークは、マルチビュー画像に由来するセマンティッ … 続きを読む
カテゴリー: cs.CV
LEAP: Enhancing Vision-Based Occupancy Networks with Lightweight Spatio-Temporal Correlation はコメントを受け付けていません
MVIP — A Dataset and Methods for Application Oriented Multi-View and Multi-Modal Industrial Part Recognition
要約 マルチモーダルおよびマルチビューアプリケーション指向の産業部品認識の新しい … 続きを読む
Memory Helps, but Confabulation Misleads: Understanding Streaming Events in Videos with MLLMs
要約 マルチモーダル大手言語モデル(MLLMS)は、ビデオを総合的に理解する上で … 続きを読む
カテゴリー: cs.CV
Memory Helps, but Confabulation Misleads: Understanding Streaming Events in Videos with MLLMs はコメントを受け付けていません
Game State and Spatio-temporal Action Detection in Soccer using Graph Neural Networks and 3D Convolutional Networks
要約 サッカー分析は、2つのデータソースに依存しています。プレーヤーがピッチ上の … 続きを読む
カテゴリー: cs.CV
Game State and Spatio-temporal Action Detection in Soccer using Graph Neural Networks and 3D Convolutional Networks はコメントを受け付けていません