「cs.AI」カテゴリーアーカイブ

Adaptive Layer Selection for Efficient Vision Transformer Fine-Tuning

投稿日: 2024年8月19日作成者: jarxiv

要約最近、ビジョントランスフォーマー (ViT) に基づく基礎モデルが広く利 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

LLM-PCGC: Large Language Model-based Point Cloud Geometry Compression

投稿日: 2024年8月19日作成者: jarxiv

要約効果的な点群圧縮の鍵は、複雑な 3D データ構造と一致する堅牢なコンテキス … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

MIMIR: Masked Image Modeling for Mutual Information-based Adversarial Robustness

投稿日: 2024年8月19日作成者: jarxiv

要約ビジョントランスフォーマー (ViT) は、さまざまなタスクで優れたパフ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Beyond the Hype: A dispassionate look at vision-language models in medical scenario

投稿日: 2024年8月19日作成者: jarxiv

要約 Large Vision-Language Model (LVLM) の最 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

A Medical Data-Effective Learning Benchmark for Highly Efficient Pre-training of Foundation Models

投稿日: 2024年8月19日作成者: jarxiv

要約大規模なデータセットで事前トレーニングされた基盤モデルは、前例のない一般化 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Correspondence-Guided SfM-Free 3D Gaussian Splatting for NVS

投稿日: 2024年8月19日作成者: jarxiv

要約 Structure-from-Motion (SfM) 前処理カメラポー … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

A Disease-Specific Foundation Model Using Over 100K Fundus Images: Release and Validation for Abnormality and Multi-Disease Classification on Downstream Tasks

投稿日: 2024年8月19日作成者: jarxiv

要約網膜画像に適用された人工知能は、網膜の状態の兆候や症状を認識し、眼疾患や全 … 続きを読む →

カテゴリー: cs.AI, cs.CV, eess.IV | コメントを受け付けていません

xGen-MM (BLIP-3): A Family of Open Large Multimodal Models

投稿日: 2024年8月19日作成者: jarxiv

要約このレポートでは、大規模マルチモーダルモデル (LMM) を開発するため … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

MathBridge: A Large Corpus Dataset for Translating Spoken Mathematical Expressions into $LaTeX$ Formulas for Improved Readability

投稿日: 2024年8月19日作成者: jarxiv

要約数学ビデオの字幕など、テキストベースの文書における数式の可読性を向上させる … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

MAG-SQL: Multi-Agent Generative Approach with Soft Schema Linking and Iterative Sub-SQL Refinement for Text-to-SQL

投稿日: 2024年8月19日作成者: jarxiv

要約最近のインコンテキスト学習ベースの手法は、Text-to-SQL タスクで … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

Adaptive Layer Selection for Efficient Vision Transformer Fine-Tuning

LLM-PCGC: Large Language Model-based Point Cloud Geometry Compression

MIMIR: Masked Image Modeling for Mutual Information-based Adversarial Robustness

Beyond the Hype: A dispassionate look at vision-language models in medical scenario

A Medical Data-Effective Learning Benchmark for Highly Efficient Pre-training of Foundation Models

Correspondence-Guided SfM-Free 3D Gaussian Splatting for NVS

A Disease-Specific Foundation Model Using Over 100K Fundus Images: Release and Validation for Abnormality and Multi-Disease Classification on Downstream Tasks

xGen-MM (BLIP-3): A Family of Open Large Multimodal Models

MathBridge: A Large Corpus Dataset for Translating Spoken Mathematical Expressions into $LaTeX$ Formulas for Improved Readability

MAG-SQL: Multi-Agent Generative Approach with Soft Schema Linking and Iterative Sub-SQL Refinement for Text-to-SQL

最近の投稿

最近のコメント

アーカイブ

カテゴリー