月別アーカイブ: 2024年6月

VWise: A novel benchmark for evaluating scene classification for vehicular applications

要約 現在の車両アプリケーションのデータセットは、ほとんどが北米またはヨーロッパ … 続きを読む

カテゴリー: cs.CV | VWise: A novel benchmark for evaluating scene classification for vehicular applications はコメントを受け付けていません

Mitigating Hallucinations in Large Vision-Language Models with Instruction Contrastive Decoding

要約 大規模視覚言語モデル (LVLM) は、視覚入力から状況に応じて詳細で一貫 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | Mitigating Hallucinations in Large Vision-Language Models with Instruction Contrastive Decoding はコメントを受け付けていません

Text-to-Image Rectified Flow as Plug-and-Play Priors

要約 大規模拡散モデルは、生成タスクにおいて顕著なパフォーマンスを達成しました。 … 続きを読む

カテゴリー: cs.CV | Text-to-Image Rectified Flow as Plug-and-Play Priors はコメントを受け付けていません

Pulmonary Embolism Mortality Prediction Using Multimodal Learning Based on Computed Tomography Angiography and Clinical Data

要約 目的: 肺塞栓症 (PE) は、米国における重大な死亡原因です。 この研究 … 続きを読む

カテゴリー: cs.CV | Pulmonary Embolism Mortality Prediction Using Multimodal Learning Based on Computed Tomography Angiography and Clinical Data はコメントを受け付けていません

L-PR: Exploiting LiDAR Fiducial Marker for Unordered Low Overlap Multiview Point Cloud Registration

要約 点群の登録は、コンピューター ビジョンやロボット工学の多くのアプリケーショ … 続きを読む

カテゴリー: cs.CV, cs.RO | L-PR: Exploiting LiDAR Fiducial Marker for Unordered Low Overlap Multiview Point Cloud Registration はコメントを受け付けていません

Learning Visual Prompts for Guiding the Attention of Vision Transformers

要約 視覚的なプロンプトは、入力画像に視覚的な情報を注入して、特定の予測やタスク … 続きを読む

カテゴリー: cs.CV | Learning Visual Prompts for Guiding the Attention of Vision Transformers はコメントを受け付けていません

The Chosen One: Consistent Characters in Text-to-Image Diffusion Models

要約 テキストから画像への生成モデルの最近の進歩により、視覚的な創造性の膨大な可 … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.LG | The Chosen One: Consistent Characters in Text-to-Image Diffusion Models はコメントを受け付けていません

Comparative Benchmarking of Failure Detection Methods in Medical Image Segmentation: Unveiling the Role of Confidence Aggregation

要約 セマンティック セグメンテーションは医用画像解析研究に不可欠な要素であり、 … 続きを読む

カテゴリー: cs.CV | Comparative Benchmarking of Failure Detection Methods in Medical Image Segmentation: Unveiling the Role of Confidence Aggregation はコメントを受け付けていません

EngineBench: Flow Reconstruction in the Transparent Combustion Chamber III Optical Engine

要約 燃焼機械内部の乱流の研究に高品質の実験データを使用する最初の機械学習 (M … 続きを読む

カテゴリー: cs.CV, physics.flu-dyn | EngineBench: Flow Reconstruction in the Transparent Combustion Chamber III Optical Engine はコメントを受け付けていません

A Flexible Recursive Network for Video Stereo Matching Based on Residual Estimation

要約 ビデオシーケンスの連続するフレーム間の視差の類似性が高いため、視差が変化す … 続きを読む

カテゴリー: cs.CV | A Flexible Recursive Network for Video Stereo Matching Based on Residual Estimation はコメントを受け付けていません