-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年8月
Cross Psuedo Supervision Framework for Sparsely Labelled Geo-spatial Images
要約 土地利用土地被覆 (LULC) マッピングは都市計画と資源計画に不可欠であ … 続きを読む
カテゴリー: cs.CV
Cross Psuedo Supervision Framework for Sparsely Labelled Geo-spatial Images はコメントを受け付けていません
Open Sesame! Universal Black Box Jailbreaking of Large Language Models
要約 役立つ安全な応答を提供するように設計された大規模言語モデル (LLM) は … 続きを読む
MaFreeI2P: A Matching-Free Image-to-Point Cloud Registration Paradigm with Active Camera Pose Retrieval
要約 画像から点群への登録では、相対的なカメラの姿勢を推定しようとしますが、デー … 続きを読む
CMR-Agent: Learning a Cross-Modal Agent for Iterative Image-to-Point Cloud Registration
要約 画像から点群への登録は、点群に対する RGB 画像の相対的なカメラ姿勢を決 … 続きを読む
Tensorial template matching for fast cross-correlation with rotations and its application for tomography
要約 オブジェクトの検出は、コンピューター ビジョンの主要なタスクです。 テンプ … 続きを読む
Multi-weather Cross-view Geo-localization Using Denoising Diffusion Models
要約 GNSS が拒否された環境におけるクロスビュー地理位置特定は、ドローンから … 続きを読む
Solving Token Gradient Conflict in Mixture-of-Experts for Large Vision-Language Model
要約 Mixture-of-Experts (MoE) は、Large Visi … 続きを読む
カテゴリー: cs.CV
Solving Token Gradient Conflict in Mixture-of-Experts for Large Vision-Language Model はコメントを受け付けていません
Zero shot VLMs for hate meme detection: Are we there yet?
要約 ソーシャル メディア上のマルチメディア コンテンツは急速に進化しており、ミ … 続きを読む
FE-Adapter: Adapting Image-based Emotion Classifiers to Videos
要約 特定のタスクに大規模な事前トレーニング済みモデルを利用することで、素晴らし … 続きを読む
カテゴリー: cs.CV
FE-Adapter: Adapting Image-based Emotion Classifiers to Videos はコメントを受け付けていません
Revolutionizing Urban Safety Perception Assessments: Integrating Multimodal Large Language Models with Street View Images
要約 都市の安全認識を測定することは重要かつ複雑なタスクであり、従来は人的資源に … 続きを読む
カテゴリー: cs.CV
Revolutionizing Urban Safety Perception Assessments: Integrating Multimodal Large Language Models with Street View Images はコメントを受け付けていません