-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Evaluating Image Hallucination in Text-to-Image Generation with Question-Answering
要約 Text-to-Image(TTI)生成モデルは目覚ましい成功を収めている … 続きを読む
SCBench: A Sports Commentary Benchmark for Video LLMs
要約 最近、学術界と産業界の両方でビデオ大規模言語モデル (ビデオ LLM) が … 続きを読む
Enhanced Temporal Processing in Spiking Neural Networks for Static Object Detection Using 3D Convolutions
要約 スパイキング ニューラル ネットワーク (SNN) は、時空間情報を処理で … 続きを読む
VidTwin: Video VAE with Decoupled Structure and Dynamics
要約 ビデオ オートエンコーダ (ビデオ AE) の最近の進歩により、ビデオ生成 … 続きを読む
DiffH2O: Diffusion-Based Synthesis of Hand-Object Interactions from Textual Descriptions
要約 3D で自然な手とオブジェクトのインタラクションを生成することは、結果とし … 続きを読む
Survey of Large Multimodal Model Datasets, Application Categories and Taxonomy
要約 人工知能の急速に進化している分野であるマルチモーダル学習は、テキスト、画像 … 続きを読む
Cross-View Referring Multi-Object Tracking
要約 マルチオブジェクト追跡 (RMOT) の参照は、現在の追跡分野における重要 … 続きを読む
Enhancing Trust in Autonomous Agents: An Architecture for Accountability and Explainability through Blockchain and Large Language Models
要約 人間の対話を伴う環境に自律エージェントを導入すると、セキュリティ上の懸念が … 続きを読む
TalkWithMachines: Enhancing Human-Robot Interaction for Interpretable Industrial Robotics Through Large/Vision Language Models
要約 TalkWithMachines は、特に安全性が重要なアプリケーション向 … 続きを読む