cs.AI」カテゴリーアーカイブ

COSMIC: Data Efficient Instruction-tuning For Speech In-Context Learning

要約 音声を大規模言語モデル (LLM) に統合し、その結果、命令追従/コンテキ … 続きを読む

カテゴリー: cs.AI, cs.CL, eess.AS | COSMIC: Data Efficient Instruction-tuning For Speech In-Context Learning はコメントを受け付けていません

Quantifying Variance in Evaluation Benchmarks

要約 評価ベンチマークは、大規模言語モデル (LLM) の機能を測定するための基 … 続きを読む

カテゴリー: cs.AI, cs.LG | Quantifying Variance in Evaluation Benchmarks はコメントを受け付けていません

First Multi-Dimensional Evaluation of Flowchart Comprehension for Multimodal Large Language Models

要約 マルチモーダル大規模言語モデル (MLLM) テクノロジーの開発により、そ … 続きを読む

カテゴリー: cs.AI, cs.CV | First Multi-Dimensional Evaluation of Flowchart Comprehension for Multimodal Large Language Models はコメントを受け付けていません

Localizing Events in Videos with Multimodal Queries

要約 ビデオの理解はデジタル時代において極めて重要なタスクですが、ビデオの動的か … 続きを読む

カテゴリー: cs.AI, cs.CV | Localizing Events in Videos with Multimodal Queries はコメントを受け付けていません

SkySenseGPT: A Fine-Grained Instruction Tuning Dataset and Model for Remote Sensing Vision-Language Understanding

要約 リモート センシング大型マルチモーダル モデル (RSLMM) は急速に開 … 続きを読む

カテゴリー: cs.AI, cs.CV | SkySenseGPT: A Fine-Grained Instruction Tuning Dataset and Model for Remote Sensing Vision-Language Understanding はコメントを受け付けていません

Diversifying Deep Ensembles: A Saliency Map Approach for Enhanced OOD Detection, Calibration, and Accuracy

要約 ディープ アンサンブルは、分類と分布外 (OOD) 検出において最先端の結 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Diversifying Deep Ensembles: A Saliency Map Approach for Enhanced OOD Detection, Calibration, and Accuracy はコメントを受け付けていません

MeshAnything: Artist-Created Mesh Generation with Autoregressive Transformers

要約 最近では、再構築と生成によって作成された 3D アセットが手動で作成された … 続きを読む

カテゴリー: cs.AI, cs.CV | MeshAnything: Artist-Created Mesh Generation with Autoregressive Transformers はコメントを受け付けていません

A Simple Interpretable Transformer for Fine-Grained Image Classification and Analysis

要約 画像分類を解釈可能にするための Transformers の新しい使用法を … 続きを読む

カテゴリー: cs.AI, cs.CV | A Simple Interpretable Transformer for Fine-Grained Image Classification and Analysis はコメントを受け付けていません

Crafting Parts for Expressive Object Composition

要約 Stable Diffusion、DALLE-2 などの大規模な生成モデル … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Crafting Parts for Expressive Object Composition はコメントを受け付けていません

SSTFB: Leveraging self-supervised pretext learning and temporal self-attention with feature branching for real-time video polyp segmentation

要約 ポリープは早期がんの指標であるため、ポリープの発生とその切除を評価すること … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | SSTFB: Leveraging self-supervised pretext learning and temporal self-attention with feature branching for real-time video polyp segmentation はコメントを受け付けていません