-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2023年9月
Sound Source Localization is All about Cross-Modal Alignment
要約 人間は、音源定位と呼ばれる、視覚的なシーンにおける音源の方向を容易に認識で … 続きを読む
Causality-Driven One-Shot Learning for Prostate Cancer Grading from MRI
要約 この論文では、画像内の弱い因果信号を学習して活用する、医療画像を自動的に分 … 続きを読む
Few-Shot Panoptic Segmentation With Foundation Models
要約 パノプティック セグメンテーションの現在の最先端の方法では、膨大な量の注釈 … 続きを読む
MMST-ViT: Climate Change-aware Crop Yield Prediction via Multi-Modal Spatial-Temporal Vision Transformer
要約 正確な作物収量予測は、農業計画と意思決定プロセスに貴重な情報を提供します。 … 続きを読む
カテゴリー: cs.CV
MMST-ViT: Climate Change-aware Crop Yield Prediction via Multi-Modal Spatial-Temporal Vision Transformer はコメントを受け付けていません
Reliable Federated Disentangling Network for Non-IID Domain Feature
要約 効果的な分散型分散学習アプローチとしてのフェデレーテッド ラーニング (F … 続きを読む
カテゴリー: cs.CV
Reliable Federated Disentangling Network for Non-IID Domain Feature はコメントを受け付けていません
SHOWMe: Benchmarking Object-agnostic Hand-Object 3D Reconstruction
要約 最近の手とオブジェクトの相互作用データセットは、実際のオブジェクトの変動性 … 続きを読む
MAGIC-TBR: Multiview Attention Fusion for Transformer-based Bodily Behavior Recognition in Group Settings
要約 身体行動言語は重要な社会的合図であり、その自動分析は人工知能システムの理解 … 続きを読む
Language as the Medium: Multimodal Video Classification through text only
要約 マルチモーダル機械学習モデルの刺激的な新しい波にもかかわらず、現在のアプロ … 続きを読む
Context-Aware Neural Video Compression on Solar Dynamics Observatory
要約 NASA の太陽力学観測所 (SDO) ミッションは、太陽の毎日の活動に関 … 続きを読む