「cs.CV」カテゴリーアーカイブ

EACO: Enhancing Alignment in Multimodal LLMs via Critical Observation

投稿日: 2024年12月9日作成者: jarxiv

要約マルチモーダル大規模言語モデル (MLLM) は、特定のデータセットを微調 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Docling Technical Report

投稿日: 2024年12月9日作成者: jarxiv

要約 Docling は、使いやすい自己完結型の MIT ライセンスのドキュメン … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.SE | コメントを受け付けていません

Gla-AI4BioMed at RRG24: Visual Instruction-tuned Adaptation for Radiology Report Generation

投稿日: 2024年12月9日作成者: jarxiv

要約胸部 X 線写真から放射線学レポートを生成するために設計された、放射線学に … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG | コメントを受け付けていません

MultiTrust: A Comprehensive Benchmark Towards Trustworthy Multimodal Large Language Models

投稿日: 2024年12月9日作成者: jarxiv

要約マルチモーダル大規模言語モデル (MLLM) はさまざまなタスクにわたって … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

LoFi: Vision-Aided Label Generator for Wi-Fi Localization and Tracking

投稿日: 2024年12月9日作成者: jarxiv

要約 Wi-Fi の位置特定と追跡は、プライバシーへの配慮、広いカバレッジ、透過 … 続きを読む →

カテゴリー: cs.CV, eess.SP | コメントを受け付けていません

Improving analytical color and texture similarity estimation methods for dataset-agnostic person reidentification

投稿日: 2024年12月9日作成者: jarxiv

要約この論文では、人間の解析、分析的特徴抽出、および類似性推定スキームを使用す … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Spinal ligaments detection on vertebrae meshes using registration and 3D edge detection

投稿日: 2024年12月9日作成者: jarxiv

要約脊椎靱帯は、骨構造に力を伝達し、動きを誘導および制限し、脊椎を安定させるた … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Reconstructing Quantitative Cerebral Perfusion Images Directly From Measured Sinogram Data Acquired Using C-arm Cone-Beam CT

投稿日: 2024年12月9日作成者: jarxiv

要約急性虚血性脳卒中患者をより適切に治療するためにドアから穿刺までの時間を短縮 … 続きを読む →

カテゴリー: cs.CV, eess.IV, physics.med-ph | コメントを受け付けていません

OpenGaussian: Towards Point-Level 3D Gaussian-based Open Vocabulary Understanding

投稿日: 2024年12月9日作成者: jarxiv

要約この論文では、3D ポイントレベルのオープンボキャブラリーの理解を可能にす … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

SoPo: Text-to-Motion Generation Using Semi-Online Preference Optimization

投稿日: 2024年12月9日作成者: jarxiv

要約テキストからモーションへの生成は、クリエイティブ産業の発展に不可欠ですが、 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

EACO: Enhancing Alignment in Multimodal LLMs via Critical Observation

Docling Technical Report

Gla-AI4BioMed at RRG24: Visual Instruction-tuned Adaptation for Radiology Report Generation

MultiTrust: A Comprehensive Benchmark Towards Trustworthy Multimodal Large Language Models

LoFi: Vision-Aided Label Generator for Wi-Fi Localization and Tracking

Improving analytical color and texture similarity estimation methods for dataset-agnostic person reidentification

Spinal ligaments detection on vertebrae meshes using registration and 3D edge detection

Reconstructing Quantitative Cerebral Perfusion Images Directly From Measured Sinogram Data Acquired Using C-arm Cone-Beam CT

OpenGaussian: Towards Point-Level 3D Gaussian-based Open Vocabulary Understanding

SoPo: Text-to-Motion Generation Using Semi-Online Preference Optimization

最近の投稿

最近のコメント

アーカイブ

カテゴリー