-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Label-Efficient Deep Learning in Medical Image Analysis: Challenges and Future Directions
要約 ディープラーニングは、多様な臨床タスク全体で最先端のパフォーマンスを達成し … 続きを読む
PlaceIt3D: Language-Guided Object Placement in Real 3D Scenes
要約 実際の3Dシーンで言語誘導オブジェクト配置の新しいタスクを紹介します。 私 … 続きを読む
Benchmarking Ophthalmology Foundation Models for Clinically Significant Age Macular Degeneration Detection
要約 自己学習学習(SSL)により、ビジョントランス(VITS)が大規模な自然画 … 続きを読む
Mapping User Trust in Vision Language Models: Research Landscape, Challenges, and Prospects
要約 大きな画像テキストおよびビデオテキストデータセットで事前に訓練されたビジョ … 続きを読む
Feature-Augmented Deep Networks for Multiscale Building Segmentation in High-Resolution UAV and Satellite Imagery
要約 高解像度のRGB画像からの正確な構築セグメンテーションは、非建設機能、影、 … 続きを読む
Time of the Flight of the Gaussians: Optimizing Depth Indirectly in Dynamic Radiance Fields
要約 単眼の連続波の飛行時間(C-TOF)カメラから動的シーンを再構築する方法を … 続きを読む
Threshold Modulation for Online Test-Time Adaptation of Spiking Neural Networks
要約 最近、神経変動チップに展開されたスパイクニューラルネットワーク(SNN)は … 続きを読む
TokLIP: Marry Visual Tokens to CLIP for Multimodal Comprehension and Generation
要約 ChameleonやEMU3などの先駆的なトークンベースの作品は、マルチモ … 続きを読む
Automated detection of underdiagnosed medical conditions via opportunistic imaging
要約 腹部コンピューター断層撮影(CT)スキャンは、臨床環境で頻繁に行われます。 … 続きを読む
StreamBridge: Turning Your Offline Video Large Language Model into a Proactive Streaming Assistant
要約 StreamBridgeを紹介します。これは、オフラインのビデオllmsを … 続きを読む