「cs.AI」カテゴリーアーカイブ

COSMIC: Data Efficient Instruction-tuning For Speech In-Context Learning

投稿日: 2024年6月17日作成者: jarxiv

要約音声を大規模言語モデル (LLM) に統合し、その結果、命令追従/コンテキ … 続きを読む →

カテゴリー: cs.AI, cs.CL, eess.AS | コメントを受け付けていません

Quantifying Variance in Evaluation Benchmarks

投稿日: 2024年6月17日作成者: jarxiv

要約評価ベンチマークは、大規模言語モデル (LLM) の機能を測定するための基 … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

First Multi-Dimensional Evaluation of Flowchart Comprehension for Multimodal Large Language Models

投稿日: 2024年6月17日作成者: jarxiv

要約マルチモーダル大規模言語モデル (MLLM) テクノロジーの開発により、そ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Localizing Events in Videos with Multimodal Queries

投稿日: 2024年6月17日作成者: jarxiv

要約ビデオの理解はデジタル時代において極めて重要なタスクですが、ビデオの動的か … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

SkySenseGPT: A Fine-Grained Instruction Tuning Dataset and Model for Remote Sensing Vision-Language Understanding

投稿日: 2024年6月17日作成者: jarxiv

要約リモートセンシング大型マルチモーダルモデル (RSLMM) は急速に開 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Diversifying Deep Ensembles: A Saliency Map Approach for Enhanced OOD Detection, Calibration, and Accuracy

投稿日: 2024年6月17日作成者: jarxiv

要約ディープアンサンブルは、分類と分布外 (OOD) 検出において最先端の結 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

MeshAnything: Artist-Created Mesh Generation with Autoregressive Transformers

投稿日: 2024年6月17日作成者: jarxiv

要約最近では、再構築と生成によって作成された 3D アセットが手動で作成された … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

A Simple Interpretable Transformer for Fine-Grained Image Classification and Analysis

投稿日: 2024年6月17日作成者: jarxiv

要約画像分類を解釈可能にするための Transformers の新しい使用法を … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Crafting Parts for Expressive Object Composition

投稿日: 2024年6月17日作成者: jarxiv

要約 Stable Diffusion、DALLE-2 などの大規模な生成モデル … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

SSTFB: Leveraging self-supervised pretext learning and temporal self-attention with feature branching for real-time video polyp segmentation

投稿日: 2024年6月17日作成者: jarxiv

要約ポリープは早期がんの指標であるため、ポリープの発生とその切除を評価すること … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

COSMIC: Data Efficient Instruction-tuning For Speech In-Context Learning

Quantifying Variance in Evaluation Benchmarks

First Multi-Dimensional Evaluation of Flowchart Comprehension for Multimodal Large Language Models

Localizing Events in Videos with Multimodal Queries

SkySenseGPT: A Fine-Grained Instruction Tuning Dataset and Model for Remote Sensing Vision-Language Understanding

Diversifying Deep Ensembles: A Saliency Map Approach for Enhanced OOD Detection, Calibration, and Accuracy

MeshAnything: Artist-Created Mesh Generation with Autoregressive Transformers

A Simple Interpretable Transformer for Fine-Grained Image Classification and Analysis

Crafting Parts for Expressive Object Composition

SSTFB: Leveraging self-supervised pretext learning and temporal self-attention with feature branching for real-time video polyp segmentation

最近の投稿

最近のコメント

アーカイブ

カテゴリー