-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年8月
Modelling Visual Semantics via Image Captioning to extract Enhanced Multi-Level Cross-Modal Semantic Incongruity Representation with Attention for Multimodal Sarcasm Detection
要約 皮肉は皮肉の一種であり、文字通りの解釈と意図された意味合いの間に本質的な不 … 続きを読む
Revisiting Class-Incremental Learning with Pre-Trained Models: Generalizability and Adaptivity are All You Need
要約 クラス増分学習 (CIL) は、古いクラスを忘れることなく、出現する新しい … 続きを読む
APARATE: Adaptive Adversarial Patch for CNN-based Monocular Depth Estimation for Autonomous Navigation
要約 最近、単眼深度推定 (MDE) のパフォーマンスが大幅に向上しました。これ … 続きを読む
SSAP: A Shape-Sensitive Adversarial Patch for Comprehensive Disruption of Monocular Depth Estimation in Autonomous Navigation Applications
要約 単眼深度推定 (MDE) は、主に畳み込みニューラル ネットワーク (CN … 続きを読む
LaMamba-Diff: Linear-Time High-Fidelity Diffusion Models Based on Local Attention and Mamba
要約 最近の Transformer ベースの拡散モデルは、顕著なパフォーマンス … 続きを読む
カテゴリー: cs.CV
LaMamba-Diff: Linear-Time High-Fidelity Diffusion Models Based on Local Attention and Mamba はコメントを受け付けていません
YOWOv3: An Efficient and Generalized Framework for Human Action Detection and Recognition
要約 この論文では、YOWOv3 と呼ばれる新しいフレームワークを提案します。こ … 続きを読む
カテゴリー: cs.CV
YOWOv3: An Efficient and Generalized Framework for Human Action Detection and Recognition はコメントを受け付けていません
Unsupervised Change Detection for Space Habitats Using 3D Point Clouds
要約 この研究では、将来の宇宙生息地での自律的なロボットによる世話を可能にする、 … 続きを読む
VidGen-1M: A Large-Scale Dataset for Text-to-video Generation
要約 ビデオとテキストのペアの品質は、基本的にテキストとビデオのモデルの上限を決 … 続きを読む
カテゴリー: cs.CV
VidGen-1M: A Large-Scale Dataset for Text-to-video Generation はコメントを受け付けていません
Interactive 3D Medical Image Segmentation with SAM 2
要約 インタラクティブ医用画像セグメンテーション (IMIS) は、医療専門家か … 続きを読む
カテゴリー: cs.CV
Interactive 3D Medical Image Segmentation with SAM 2 はコメントを受け付けていません
On Using Quasirandom Sequences in Machine Learning for Model Weight Initialization
要約 ニューラル ネットワークのトレーニングの有効性は、機械学習アプリケーション … 続きを読む