月別アーカイブ: 2025年3月

GSPR: Multimodal Place Recognition Using 3D Gaussian Splatting for Autonomous Driving

要約 場所の認識は、自律型の車両がGPS除去された環境でローカリゼーション結果を … 続きを読む

カテゴリー: cs.CV | GSPR: Multimodal Place Recognition Using 3D Gaussian Splatting for Autonomous Driving はコメントを受け付けていません

ViT-VS: On the Applicability of Pretrained Vision Transformer Features for Generalizable Visual Servoing

要約 ビジュアルサーボにより、ロボットはターゲットオブジェクトに対してエンドエフ … 続きを読む

カテゴリー: cs.CV, cs.RO | ViT-VS: On the Applicability of Pretrained Vision Transformer Features for Generalizable Visual Servoing はコメントを受け付けていません

X-Boundary: Establishing Exact Safety Boundary to Shield LLMs from Multi-Turn Jailbreaks without Compromising Usability

要約 LLMSの安全アライメント技術の急速な発展にもかかわらず、マルチターンの脱 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.CV, cs.LG | X-Boundary: Establishing Exact Safety Boundary to Shield LLMs from Multi-Turn Jailbreaks without Compromising Usability はコメントを受け付けていません

Omnidirectional Multi-Object Tracking

要約 360 {\ deg}の視野を備えたパノラマ画像は、周囲のオブジェクトの空 … 続きを読む

カテゴリー: cs.CV, cs.RO, eess.IV | Omnidirectional Multi-Object Tracking はコメントを受け付けていません

A Benchmark for Multi-Lingual Vision-Language Learning in Remote Sensing Image Captioning

要約 リモートセンシング画像キャプション(RSIC)は、クロスモーダルフィールド … 続きを読む

カテゴリー: cs.CV | A Benchmark for Multi-Lingual Vision-Language Learning in Remote Sensing Image Captioning はコメントを受け付けていません

Enhancing Multimodal Medical Image Classification using Cross-Graph Modal Contrastive Learning

要約 医療画像の分類は、疾患診断の極めて重要な側面であり、多くの場合、深い学習技 … 続きを読む

カテゴリー: cs.CV, eess.IV | Enhancing Multimodal Medical Image Classification using Cross-Graph Modal Contrastive Learning はコメントを受け付けていません

The Best of Both Worlds: Integrating Language Models and Diffusion Models for Video Generation

要約 テキストからビデオへの最近の進歩(T2V)の生成は、自己回帰言語モデルと拡 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | The Best of Both Worlds: Integrating Language Models and Diffusion Models for Video Generation はコメントを受け付けていません

Self-supervised pre-training with diffusion model for few-shot landmark detection in x-ray images

要約 深いニューラルネットワークは、画像分類、セグメンテーション、ランドマーク検 … 続きを読む

カテゴリー: cs.AI, cs.CV | Self-supervised pre-training with diffusion model for few-shot landmark detection in x-ray images はコメントを受け付けていません

Human-Feedback Efficient Reinforcement Learning for Online Diffusion Model Finetuning

要約 安定した拡散(SD)微調整による制御可能な生成は、忠実度、安全性、および人 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.HC, cs.LG | Human-Feedback Efficient Reinforcement Learning for Online Diffusion Model Finetuning はコメントを受け付けていません

LLM-wrapper: Black-Box Semantic-Aware Adaptation of Vision-Language Models for Referring Expression Comprehension

要約 ビジョン言語モデル(VLMS)は、さまざまなオープンボキャブラリータスクで … 続きを読む

カテゴリー: cs.CV | LLM-wrapper: Black-Box Semantic-Aware Adaptation of Vision-Language Models for Referring Expression Comprehension はコメントを受け付けていません