-
最近の投稿
- Predicting center of mass position in non-cyclic activities: The influence of acceleration, prediction horizon, and ground reaction forces
- Are Transformers Truly Foundational for Robotics?
- Performance Evaluation of Deep Learning-Based State Estimation: A Comparative Study of KalmanNet
- Performance Assessment of Lidar Odometry Frameworks: A Case Study at the Australian Botanic Garden Mount Annan
- VLM-Social-Nav: Socially Aware Robot Navigation through Scoring using Vision-Language Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (30189) cs.CL (22805) cs.CR (2340) cs.CV (36561) cs.LG (35013) cs.RO (17553) cs.SY (2697) eess.IV (4453) eess.SY (2691) stat.ML (4664)
月別アーカイブ: 2024年5月
Deep Network Pruning: A Comparative Study on CNNs in Face Recognition
要約 あらゆる種類の取引にモバイル デバイスが広く使用されるようになったことで、 … 続きを読む
カテゴリー: cs.CV
Deep Network Pruning: A Comparative Study on CNNs in Face Recognition はコメントを受け付けていません
Multi-modal Generation via Cross-Modal In-Context Learning
要約 この研究では、複雑なマルチモーダル プロンプト シーケンスから新しい画像を … 続きを読む
カテゴリー: cs.CV
Multi-modal Generation via Cross-Modal In-Context Learning はコメントを受け付けていません
Mind-to-Image: Projecting Visual Mental Imagination of the Brain from fMRI
要約 視覚刺激中に収集された fMRI データから被験者が観察した画像の再構成は … 続きを読む
Self-Supervised Learning Based Handwriting Verification
要約 手書き検証のタスクに適用される SSL-HV: 自己教師あり学習アプローチ … 続きを読む
SCE-MAE: Selective Correspondence Enhancement with Masked Autoencoder for Self-Supervised Landmark Estimation
要約 自己教師ありランドマーク推定は、注釈付きデータがない場合にまばらな顔のラン … 続きを読む
VITON-DiT: Learning In-the-Wild Video Try-On from Human Dance Videos via Diffusion Transformers
要約 ビデオ試着は、現実世界での大きな可能性を秘めた有望な分野です。 これまでの … 続きを読む
カテゴリー: cs.CV
VITON-DiT: Learning In-the-Wild Video Try-On from Human Dance Videos via Diffusion Transformers はコメントを受け付けていません
Histopathology Based AI Model Predicts Anti-Angiogenic Therapy Response in Renal Cancer Clinical Trial
要約 血管新生阻害剤、免疫チェックポイント阻害剤、mTOR阻害剤、HIF2阻害剤 … 続きを読む
Efficient Remote Sensing with Harmonized Transfer Learning and Modality Alignment
要約 Visual and Language Pretraining (VLP) … 続きを読む
Frustratingly Easy Test-Time Adaptation of Vision-Language Models
要約 視覚言語モデルは、任意の意味カテゴリをシームレスに識別しますが、それでも、 … 続きを読む
SketchQL Demonstration: Zero-shot Video Moment Querying with Sketches
要約 このペーパーでは、スケッチベースのクエリ インターフェイスを使用してビデオ … 続きを読む