投稿者「jarxiv」のアーカイブ

Multimodal LLMs Can Reason about Aesthetics in Zero-Shot

要約 我々は、芸術作品の美しさを評価するためにマルチモーダルLLM(MLLM)の … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | コメントする

T2V-CompBench: A Comprehensive Benchmark for Compositional Text-to-video Generation

要約 Text-to-Video (T2V) 生成モデルは大幅に進歩しましたが、 … 続きを読む

カテゴリー: cs.CV | コメントする

Ouroboros-Diffusion: Exploring Consistent Content Generation in Tuning-free Long Video Diffusion

要約 事前トレーニングされたテキストからビデオへのモデルに基づいて構築された先入 … 続きを読む

カテゴリー: cs.CV | コメントする

Consistency of Responses and Continuations Generated by Large Language Models on Social Media

要約 大規模言語モデル (LLM) はテキスト生成において顕著な機能を示していま … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.HC | コメントする

Evaluation of Artificial Intelligence Methods for Lead Time Prediction in Non-Cycled Areas of Automotive Production

要約 本研究では、サイクル管理されていない生産領域における未知のリードタイムを予 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | コメントする

AfriHate: A Multilingual Collection of Hate Speech and Abusive Language Datasets for African Languages

要約 ヘイトスピーチや暴言は世界的な現象であり、理解、特定、緩和するには社会文化 … 続きを読む

カテゴリー: cs.CL | コメントする

GestLLM: Advanced Hand Gesture Interpretation via Large Language Models for Human-Robot Interaction

要約 この文書では、手のジェスチャーによる直感的なロボット制御を可能にする、人間 … 続きを読む

カテゴリー: cs.RO | コメントする

KaLM-Embedding: Superior Training Data Brings A Stronger Embedding Model

要約 大規模な言語モデルでは検索拡張生成が普及するにつれて、埋め込みモデルの重要 … 続きを読む

カテゴリー: cs.CL | コメントする

Data-driven inventory management for new products: A warm-start and adjusted Dyna-$Q$ approach

要約 この論文では、過去の需要情報がまったくない、または限られている新発売製品の … 続きを読む

カテゴリー: cs.AI, cs.CE, cs.LG | コメントする

A Multi-Modal AI Copilot for Single-Cell Analysis with Instruction Following

要約 大規模な言語モデルは、複雑な自然言語命令の解釈に優れており、幅広いタスクを … 続きを読む

カテゴリー: cs.AI, cs.CE, cs.CL, cs.HC, cs.LG, q-bio.CB | コメントする