投稿者「jarxiv」のアーカイブ

Text2Data: Low-Resource Data Generation with Textual Control

投稿日: 2025年1月3日作成者: jarxiv

要約自然言語は、人間が機械とシームレスに対話するための共通かつ直接的な信号とし … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Sparsely Multimodal Data Fusion

投稿日: 2025年1月3日作成者: jarxiv

要約マルチモーダルデータフュージョンは、特に不完全なモダリティや利用可能な … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

MEDEC: A Benchmark for Medical Error Detection and Correction in Clinical Notes

投稿日: 2025年1月3日作成者: jarxiv

要約いくつかの研究では、大規模言語モデル (LLM) が医療質問に正確に回答で … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Personalized Lip Reading: Adapting to Your Unique Lip Movements with Vision and Language

投稿日: 2025年1月3日作成者: jarxiv

要約読唇術は、唇の動きを分析することで話し言葉を予測することを目的としています … 続きを読む →

カテゴリー: cs.CL, cs.CV, eess.AS, eess.IV | コメントを受け付けていません

Detection of adrenal anomalous findings in spinal CT images using multi model graph aggregation

投稿日: 2025年1月3日作成者: jarxiv

要約腰痛は、プライマリケア医に 2 番目に頻繁に報告される症状であり、人口の … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Mining Platoon Patterns from Traffic Videos

投稿日: 2025年1月3日作成者: jarxiv

要約都市規模のビデオデータソースから共同移動パターンを発見することは、魅力 … 続きを読む →

カテゴリー: cs.CV, cs.DB | コメントを受け付けていません

Keypoint Aware Masked Image Modelling

投稿日: 2025年1月3日作成者: jarxiv

要約 SimMIM は、マスクされた画像モデリングを使用してビジョントランスフ … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Robust Self-calibration of Focal Lengths from the Fundamental Matrix

投稿日: 2025年1月3日作成者: jarxiv

要約与えられた基本行列から 2 台のカメラを自己校正する問題は、幾何学的なコン … 続きを読む →

カテゴリー: cs.CV, I.4.0 | コメントを受け付けていません

NeurTV: Total Variation on the Neural Domain

投稿日: 2025年1月3日作成者: jarxiv

要約最近、多くのイメージングアプリケーションでトータルバリエーション (T … 続きを読む →

カテゴリー: 68T45, 68U10, 94A08, cs.CV, eess.IV | コメントを受け付けていません

Instruction-Guided Scene Text Recognition

投稿日: 2025年1月3日作成者: jarxiv

要約マルチモーダルモデルは、自由形式のテキストガイドによるトレーニングにより … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

投稿者「jarxiv」のアーカイブ

Text2Data: Low-Resource Data Generation with Textual Control

Sparsely Multimodal Data Fusion

MEDEC: A Benchmark for Medical Error Detection and Correction in Clinical Notes

Personalized Lip Reading: Adapting to Your Unique Lip Movements with Vision and Language

Detection of adrenal anomalous findings in spinal CT images using multi model graph aggregation

Mining Platoon Patterns from Traffic Videos

Keypoint Aware Masked Image Modelling

Robust Self-calibration of Focal Lengths from the Fundamental Matrix

NeurTV: Total Variation on the Neural Domain

Instruction-Guided Scene Text Recognition

最近の投稿

最近のコメント

アーカイブ

カテゴリー