月別アーカイブ: 2024年2月

GaMeS: Mesh-Based Adapting and Modification of Gaussian Splatting

要約 近年、画像レンダリングのためのニューラル ネットワーク ベースのさまざまな … 続きを読む

カテゴリー: cs.CV | GaMeS: Mesh-Based Adapting and Modification of Gaussian Splatting はコメントを受け付けていません

AnomalyCLIP: Object-agnostic Prompt Learning for Zero-shot Anomaly Detection

要約 ゼロショット異常検出 (ZSAD) では、ターゲット データセット内のトレ … 続きを読む

カテゴリー: cs.CV | AnomalyCLIP: Object-agnostic Prompt Learning for Zero-shot Anomaly Detection はコメントを受け付けていません

OVOR: OnePrompt with Virtual Outlier Regularization for Rehearsal-Free Class-Incremental Learning

要約 最近の研究では、学習可能なプロンプトとともに大規模な事前トレーニング済みモ … 続きを読む

カテゴリー: cs.CV, cs.LG | OVOR: OnePrompt with Virtual Outlier Regularization for Rehearsal-Free Class-Incremental Learning はコメントを受け付けていません

Beyond Hallucinations: Enhancing LVLMs through Hallucination-Aware Direct Preference Optimization

要約 マルチモーダル大規模言語モデルは近年大幅な進歩を遂げていますが、依然として … 続きを読む

カテゴリー: cs.CL, cs.CV | Beyond Hallucinations: Enhancing LVLMs through Hallucination-Aware Direct Preference Optimization はコメントを受け付けていません

U-shaped Vision Mamba for Single Image Dehazing

要約 現在、Transformer は画像のかすみ除去用の最も一般的なアーキテク … 続きを読む

カテゴリー: cs.CV | U-shaped Vision Mamba for Single Image Dehazing はコメントを受け付けていません

MI-SegNet: Mutual Information-Based US Segmentation for Unseen Domain Generalization

要約 ドメイン全体にわたる学習ベースの医用画像セグメンテーションの一般化機能は、 … 続きを読む

カテゴリー: cs.CV, eess.IV | MI-SegNet: Mutual Information-Based US Segmentation for Unseen Domain Generalization はコメントを受け付けていません

Informed Reinforcement Learning for Situation-Aware Traffic Rule Exceptions

要約 強化学習は、将来が期待される非常に活発な研究分野です。 ただし、自動運転の … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Informed Reinforcement Learning for Situation-Aware Traffic Rule Exceptions はコメントを受け付けていません

3D Volumetric Super-Resolution in Radiology Using 3D RRDB-GAN

要約 この研究では、放射線画像の 3D 超解像度のための 3D Residual … 続きを読む

カテゴリー: cs.CV, eess.IV | 3D Volumetric Super-Resolution in Radiology Using 3D RRDB-GAN はコメントを受け付けていません

SHIELD : An Evaluation Benchmark for Face Spoofing and Forgery Detection with Multimodal Large Language Models

要約 マルチモーダル大規模言語モデル (MLLM) は、強力な視覚的意味表現と言 … 続きを読む

カテゴリー: cs.CV | SHIELD : An Evaluation Benchmark for Face Spoofing and Forgery Detection with Multimodal Large Language Models はコメントを受け付けていません

ViT-DD: Multi-Task Vision Transformer for Semi-Supervised Driver Distraction Detection

要約 現代の運転における交通安全の確保と事故の軽減は最も重要であり、コンピュータ … 続きを読む

カテゴリー: cs.CV | ViT-DD: Multi-Task Vision Transformer for Semi-Supervised Driver Distraction Detection はコメントを受け付けていません