-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Seeing is Understanding: Unlocking Causal Attention into Modality-Mutual Attention for Multimodal LLMs
要約 最近のマルチモーダル大手言語モデル(MLLMS)は、マルチモーダルの問い合 … 続きを読む
WalnutData: A UAV Remote Sensing Dataset of Green Walnuts and Model Evaluation
要約 UAVテクノロジーは徐々に成熟しており、スマートな農業と正確な監視に対する … 続きを読む
R2Det: Exploring Relaxed Rotation Equivariance in 2D object detection
要約 Group Equivariant Convolution(GCONV)は … 続きを読む
A dataset-free approach for self-supervised learning of 3D reflectional symmetries
要約 このホワイトペーパーでは、入力オブジェクト自体のみでデータセットに依存する … 続きを読む
State of play and future directions in industrial computer vision AI standards
要約 人工知能(AI)とディープラーニング(DL)の分野における最近の途方もない … 続きを読む
Class-Aware PillarMix: Can Mixed Sample Data Augmentation Enhance 3D Object Detection with Radar Point Clouds?
要約 3D認識タスクでのデータ収集と注釈に必要な努力により、既存のデータを混合す … 続きを読む
Memory Efficient Continual Learning for Edge-Based Visual Anomaly Detection
要約 視覚異常検出(VAD)は、多数の現実世界のアプリケーションを備えたコンピュ … 続きを読む
WalkVLM:Aid Visually Impaired People Walking by Vision Language Model
要約 世界中の約2億人の個人が視覚障害の程度がさまざまであるため、AIテクノロジ … 続きを読む
A Comprehensive Survey on Composed Image Retrieval
要約 Composed Image Retrieval(CIR)は、ユーザーが参 … 続きを読む
UAR-NVC: A Unified AutoRegressive Framework for Memory-Efficient Neural Video Compression
要約 暗黙の神経表現(INR)は、ビデオをニューラルネットワークとして表現するこ … 続きを読む