-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Hierarchical localization with panoramic views and triplet loss functions
要約 この論文の主な目的は、移動ロボットの安全なナビゲーションに不可欠な視覚的位 … 続きを読む
Semantically-Prompted Language Models Improve Visual Descriptions
要約 CLIP のような言語視覚モデルは、ゼロショット画像分類 (ZSIC) な … 続きを読む
Controlling Language and Diffusion Models by Transporting Activations
要約 大規模な生成モデルの機能が向上し、その導入がますます広範囲に行われるように … 続きを読む
OminiControl: Minimal and Universal Control for Diffusion Transformer
要約 このペーパーでは、画像条件を事前トレーニング済みの拡散変換 (DiT) モ … 続きを読む
About Time: Advances, Challenges, and Outlooks of Action Understanding
要約 私たちは、ビデオアクションの理解における目覚ましい進歩を目の当たりにしてき … 続きを読む
Efficient Pruning of Text-to-Image Models: Insights from Pruning Stable Diffusion
要約 テキストから画像へのモデルがますます強力かつ複雑になるにつれて、そのサイズ … 続きを読む
VideoRepair: Improving Text-to-Video Generation via Misalignment Evaluation and Localized Refinement
要約 最近のテキストからビデオへの (T2V) 普及モデルは、さまざまなドメイン … 続きを読む
ReXrank: A Public Leaderboard for AI-Powered Radiology Report Generation
要約 AI 駆動モデルは、胸部 X 線検査の放射線レポート生成の自動化において大 … 続きを読む
Health AI Developer Foundations
要約 堅牢な医療機械学習 (ML) モデルは、臨床研究を加速し、ワークフローと結 … 続きを読む