-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年3月
GSPR: Multimodal Place Recognition Using 3D Gaussian Splatting for Autonomous Driving
要約 場所の認識は、自律型の車両がGPS除去された環境でローカリゼーション結果を … 続きを読む
カテゴリー: cs.CV
GSPR: Multimodal Place Recognition Using 3D Gaussian Splatting for Autonomous Driving はコメントを受け付けていません
ViT-VS: On the Applicability of Pretrained Vision Transformer Features for Generalizable Visual Servoing
要約 ビジュアルサーボにより、ロボットはターゲットオブジェクトに対してエンドエフ … 続きを読む
X-Boundary: Establishing Exact Safety Boundary to Shield LLMs from Multi-Turn Jailbreaks without Compromising Usability
要約 LLMSの安全アライメント技術の急速な発展にもかかわらず、マルチターンの脱 … 続きを読む
Omnidirectional Multi-Object Tracking
要約 360 {\ deg}の視野を備えたパノラマ画像は、周囲のオブジェクトの空 … 続きを読む
A Benchmark for Multi-Lingual Vision-Language Learning in Remote Sensing Image Captioning
要約 リモートセンシング画像キャプション(RSIC)は、クロスモーダルフィールド … 続きを読む
カテゴリー: cs.CV
A Benchmark for Multi-Lingual Vision-Language Learning in Remote Sensing Image Captioning はコメントを受け付けていません
Enhancing Multimodal Medical Image Classification using Cross-Graph Modal Contrastive Learning
要約 医療画像の分類は、疾患診断の極めて重要な側面であり、多くの場合、深い学習技 … 続きを読む
The Best of Both Worlds: Integrating Language Models and Diffusion Models for Video Generation
要約 テキストからビデオへの最近の進歩(T2V)の生成は、自己回帰言語モデルと拡 … 続きを読む
Self-supervised pre-training with diffusion model for few-shot landmark detection in x-ray images
要約 深いニューラルネットワークは、画像分類、セグメンテーション、ランドマーク検 … 続きを読む
Human-Feedback Efficient Reinforcement Learning for Online Diffusion Model Finetuning
要約 安定した拡散(SD)微調整による制御可能な生成は、忠実度、安全性、および人 … 続きを読む
LLM-wrapper: Black-Box Semantic-Aware Adaptation of Vision-Language Models for Referring Expression Comprehension
要約 ビジョン言語モデル(VLMS)は、さまざまなオープンボキャブラリータスクで … 続きを読む
カテゴリー: cs.CV
LLM-wrapper: Black-Box Semantic-Aware Adaptation of Vision-Language Models for Referring Expression Comprehension はコメントを受け付けていません