-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Action2Sound: Ambient-Aware Generation of Action Sounds from Egocentric Videos
要約 人間のインタラクション用にリアルなオーディオを生成することは、映画や仮想現 … 続きを読む
MambaMixer: Efficient Selective State Space Models with Dual Token and Channel Selection
要約 深層学習の最近の進歩は、データの依存性と大規模な学習能力により、主に Tr … 続きを読む
IRASim: Learning Interactive Real-Robot Action Simulators
要約 現実世界でのスケーラブルなロボット学習は、実際のロボットのコストと安全性の … 続きを読む
Whiteboard-of-Thought: Thinking Step-by-Step Across Modalities
要約 視覚的思考を伴う質問が提示されると、人間は自然に推論方法を切り替え、しばし … 続きを読む
Transformers Can Represent $n$-gram Language Models
要約 既存の研究では、計算の形式的なモデルを使用して、変圧器アーキテクチャの表現 … 続きを読む
Graph Neural Networks in Histopathology: Emerging Trends and Future Directions
要約 全スライド画像 (WSI) の組織病理学的分析では、深層学習手法、特に畳み … 続きを読む
Informatics & dairy industry coalition: AI trends and present challenges
要約 人工知能 (AI) は、生産プロセスを強化し、手作業の繰り返し作業を最小限 … 続きを読む
Probabilistic Conceptual Explainers: Trustworthy Conceptual Explanations for Vision Foundation Models
要約 ビジョン トランスフォーマー (ViT) は、特に大規模な言語モデルと共同 … 続きを読む
Crossfusor: A Cross-Attention Transformer Enhanced Conditional Diffusion Model for Car-Following Trajectory Prediction
要約 車両軌道予測は、自動運転と先進運転支援システム (ADAS) を進化させ、 … 続きを読む
Online Pareto-Optimal Decision-Making for Complex Tasks using Active Inference
要約 ロボットが複雑なタスクを自律的に実行する場合、安全性を維持しながら競合する … 続きを読む