「H.5.1」カテゴリーアーカイブ

MVTamperBench: Evaluating Robustness of Vision-Language Models

投稿日: 2025年6月12日作成者: jarxiv

要約マルチモーダル大手言語モデル（MLLMS）は、ビデオ理解の大きな進歩を促進 … 続きを読む →

カテゴリー: 68Q32, 68Q85, 68T05, 68T37, 68T40, 68T45, 94A08, cs.CV, H.5.1 | コメントを受け付けていません

投稿日: 2025年5月8日作成者: jarxiv

要約オーディオSDSを紹介します。オーディオSDは、テキストコンディショニング … 続きを読む →

カテゴリー: 68T07, cs.AI, cs.LG, cs.MM, cs.SD, eess.AS, H.5.1 | コメントを受け付けていません

投稿日: 2025年4月8日作成者: jarxiv

要約人工知能が選択されたタスクで人間のパフォーマンスを上回るので、超人的な能力 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CY, cs.ET, cs.HC, H.5.1 | コメントを受け付けていません

投稿日: 2025年4月3日作成者: jarxiv

要約オーディオビジュアル質問応答（AVQA）は、ペアのオーディオビデオ入力に基 … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.MM, H.5.1 | コメントを受け付けていません

投稿日: 2025年2月25日作成者: jarxiv

要約ヘルスケアワーカー（HCWS）は、拡張現実ヘッドマウントディスプレイ（AR … 続きを読む →

カテゴリー: cs.HC, cs.RO, H.5.1, J.3 | コメントを受け付けていません