「68T45」カテゴリーアーカイブ

ASCD: Attention-Steerable Contrastive Decoding for Reducing Hallucination in MLLM

投稿日: 2025年6月18日作成者: jarxiv

要約マルチモーダル大手言語モデル（MLLM）はしばしば幻覚に苦しんでいます。 … 続きを読む →

カテゴリー: 68T45, cs.CL, cs.CV | コメントを受け付けていません

Hierarchical Multi-Positive Contrastive Learning for Patent Image Retrieval

投稿日: 2025年6月17日作成者: jarxiv

要約特許画像は、特許の革新に関する情報を伝える技術的な図面です。特許画像検索 … 続きを読む →

カテゴリー: 68T07, 68T45, cs.CV, cs.IR, cs.LG, H.3.3 | コメントを受け付けていません

MVTamperBench: Evaluating Robustness of Vision-Language Models

投稿日: 2025年6月12日作成者: jarxiv

要約マルチモーダル大手言語モデル（MLLMS）は、ビデオ理解の大きな進歩を促進 … 続きを読む →

カテゴリー: 68Q32, 68Q85, 68T05, 68T37, 68T40, 68T45, 94A08, cs.CV, H.5.1 | コメントを受け付けていません

Kvasir-VQA-x1: A Multimodal Dataset for Medical Reasoning and Robust MedVQA in Gastrointestinal Endoscopy

投稿日: 2025年6月12日作成者: jarxiv

要約医学的視覚的質問応答（MEDVQA）は、臨床的意思決定支援システムを開発す … 続きを読む →

カテゴリー: 68T45, 92C55, cs.CV, cs.LG, I.2.10 | コメントを受け付けていません

Black-box Adversarial Attacks on CNN-based SLAM Algorithms

投稿日: 2025年6月2日作成者: jarxiv

要約深い学習の継続的な進歩により、機能検出が大幅に進歩し、同時ローカリゼーショ … 続きを読む →

カテゴリー: (Primary), 68M25, 68T40, 68T45, cs.CV, cs.RO | コメントを受け付けていません

ReasonPlan: Unified Scene Prediction and Decision Reasoning for Closed-loop Autonomous Driving

投稿日: 2025年5月27日作成者: jarxiv

要約強力なビジョン言語の推論と一般化能力により、マルチモーダルの大手言語モデル … 続きを読む →

カテゴリー: 68T40(Primary), 68T45, 68T50(Secondary), cs.AI, cs.CV, cs.RO, I.2.10 | コメントを受け付けていません

Instance Segmentation for Point Sets

投稿日: 2025年5月21日作成者: jarxiv

要約 PointNet [QSMG16]やPointNet ++ [Qysg17 … 続きを読む →

カテゴリー: 68T45, cs.CV, cs.LG, I.2.10 | コメントを受け付けていません

3D Reconstruction from Sketches

投稿日: 2025年5月21日作成者: jarxiv

要約複数のスケッチから3Dシーンを再構築する問題を検討します。（1）通信ポイ … 続きを読む →

カテゴリー: 68T45, cs.CV, cs.LG, I.2.10 | コメントを受け付けていません

GP-GS: Gaussian Processes for Enhanced Gaussian Splatting

投稿日: 2025年5月14日作成者: jarxiv

要約 3Dガウスのスプラッティングは、効率的なフォトリアリスティックな新規ビュー … 続きを読む →

カテゴリー: 68T45, cs.AI, cs.CV | コメントを受け付けていません

GP-GS: Gaussian Processes for Enhanced Gaussian Splatting

投稿日: 2025年5月13日作成者: jarxiv

要約 3Dガウスのスプラッティングは、効率的なフォトリアリスティックな新規ビュー … 続きを読む →

カテゴリー: 68T45, cs.AI, cs.CV | コメントを受け付けていません

「68T45」カテゴリーアーカイブ

ASCD: Attention-Steerable Contrastive Decoding for Reducing Hallucination in MLLM

Hierarchical Multi-Positive Contrastive Learning for Patent Image Retrieval

MVTamperBench: Evaluating Robustness of Vision-Language Models

Kvasir-VQA-x1: A Multimodal Dataset for Medical Reasoning and Robust MedVQA in Gastrointestinal Endoscopy

Black-box Adversarial Attacks on CNN-based SLAM Algorithms

ReasonPlan: Unified Scene Prediction and Decision Reasoning for Closed-loop Autonomous Driving

Instance Segmentation for Point Sets

3D Reconstruction from Sketches

GP-GS: Gaussian Processes for Enhanced Gaussian Splatting

GP-GS: Gaussian Processes for Enhanced Gaussian Splatting

最近の投稿

最近のコメント

アーカイブ

カテゴリー