-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年8月
Static IR Drop Prediction with Attention U-Net and Saliency-Based Explainability
要約 最近、ニューラル ネットワークを使用した静的 IR ドロップ解析と、画像間 … 続きを読む
KaPO: Knowledge-aware Preference Optimization for Controllable Knowledge Selection in Retrieval-Augmented Language Models
要約 外部知識を統合することにより、検索拡張生成 (RAG) は、知識集約型タス … 続きを読む
Understanding How Blind Users Handle Object Recognition Errors: Strategies and Challenges
要約 物体認識テクノロジーは、目の見えない人や弱視の人が周囲の世界を移動できるよ … 続きを読む
Training LLMs to Recognize Hedges in Spontaneous Narratives
要約 ヘッジを使用すると、話者は、非原型性または「あいまいさ」を示すかどうか、発 … 続きを読む
MoMa: Efficient Early-Fusion Pre-training with Mixture of Modality-Aware Experts
要約 混合モーダルの初期融合言語モデルを事前トレーニングするために設計された、新 … 続きを読む
Prototype Learning for Micro-gesture Classification
要約 このペーパーでは、IJCAI 2024 の MiGA チャレンジにおけるマ … 続きを読む
カテゴリー: cs.CV
Prototype Learning for Micro-gesture Classification はコメントを受け付けていません
Multi-Agent 3D Map Reconstruction and Change Detection in Microgravity with Free-Flying Robots
要約 国際宇宙ステーション (ISS) にある NASA の Astrobee … 続きを読む
Source-Free Domain-Invariant Performance Prediction
要約 モデルのパフォーマンスを正確に推定することは、特にソース ドメインとターゲ … 続きを読む
カテゴリー: cs.CV
Source-Free Domain-Invariant Performance Prediction はコメントを受け付けていません
Benchmarking In-the-wild Multimodal Disease Recognition and A Versatile Baseline
要約 既存の植物病害分類モデルは、研究室内の病害画像の認識において顕著な性能を達 … 続きを読む
カテゴリー: cs.CV
Benchmarking In-the-wild Multimodal Disease Recognition and A Versatile Baseline はコメントを受け付けていません
FBSDiff: Plug-and-Play Frequency Band Substitution of Diffusion Features for Highly Controllable Text-Driven Image Translation
要約 大規模なテキストから画像への拡散モデルは、生成 AI とマルチモーダル テ … 続きを読む