cs.CV」カテゴリーアーカイブ

EACO: Enhancing Alignment in Multimodal LLMs via Critical Observation

要約 マルチモーダル大規模言語モデル (MLLM) は、特定のデータセットを微調 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | EACO: Enhancing Alignment in Multimodal LLMs via Critical Observation はコメントを受け付けていません

Docling Technical Report

要約 Docling は、使いやすい自己完結型の MIT ライセンスのドキュメン … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.SE | Docling Technical Report はコメントを受け付けていません

Gla-AI4BioMed at RRG24: Visual Instruction-tuned Adaptation for Radiology Report Generation

要約 胸部 X 線写真から放射線学レポートを生成するために設計された、放射線学に … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | Gla-AI4BioMed at RRG24: Visual Instruction-tuned Adaptation for Radiology Report Generation はコメントを受け付けていません

MultiTrust: A Comprehensive Benchmark Towards Trustworthy Multimodal Large Language Models

要約 マルチモーダル大規模言語モデル (MLLM) はさまざまなタスクにわたって … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | MultiTrust: A Comprehensive Benchmark Towards Trustworthy Multimodal Large Language Models はコメントを受け付けていません

LoFi: Vision-Aided Label Generator for Wi-Fi Localization and Tracking

要約 Wi-Fi の位置特定と追跡は、プライバシーへの配慮、広いカバレッジ、透過 … 続きを読む

カテゴリー: cs.CV, eess.SP | LoFi: Vision-Aided Label Generator for Wi-Fi Localization and Tracking はコメントを受け付けていません

Improving analytical color and texture similarity estimation methods for dataset-agnostic person reidentification

要約 この論文では、人間の解析、分析的特徴抽出、および類似性推定スキームを使用す … 続きを読む

カテゴリー: cs.CV | Improving analytical color and texture similarity estimation methods for dataset-agnostic person reidentification はコメントを受け付けていません

Spinal ligaments detection on vertebrae meshes using registration and 3D edge detection

要約 脊椎靱帯は、骨構造に力を伝達し、動きを誘導および制限し、脊椎を安定させるた … 続きを読む

カテゴリー: cs.CV | Spinal ligaments detection on vertebrae meshes using registration and 3D edge detection はコメントを受け付けていません

Reconstructing Quantitative Cerebral Perfusion Images Directly From Measured Sinogram Data Acquired Using C-arm Cone-Beam CT

要約 急性虚血性脳卒中患者をより適切に治療するためにドアから穿刺までの時間を短縮 … 続きを読む

カテゴリー: cs.CV, eess.IV, physics.med-ph | Reconstructing Quantitative Cerebral Perfusion Images Directly From Measured Sinogram Data Acquired Using C-arm Cone-Beam CT はコメントを受け付けていません

OpenGaussian: Towards Point-Level 3D Gaussian-based Open Vocabulary Understanding

要約 この論文では、3D ポイントレベルのオープンボキャブラリーの理解を可能にす … 続きを読む

カテゴリー: cs.CV, cs.RO | OpenGaussian: Towards Point-Level 3D Gaussian-based Open Vocabulary Understanding はコメントを受け付けていません

SoPo: Text-to-Motion Generation Using Semi-Online Preference Optimization

要約 テキストからモーションへの生成は、クリエイティブ産業の発展に不可欠ですが、 … 続きを読む

カテゴリー: cs.CV | SoPo: Text-to-Motion Generation Using Semi-Online Preference Optimization はコメントを受け付けていません