投稿者「jarxiv」のアーカイブ

SimGen: A Diffusion-Based Framework for Simultaneous Surgical Image and Segmentation Mask Generation

要約 外科データの取得と注釈付けは多くの場合、リソースを大量に消費し、倫理的な制 … 続きを読む

カテゴリー: cs.CV | SimGen: A Diffusion-Based Framework for Simultaneous Surgical Image and Segmentation Mask Generation はコメントを受け付けていません

Multimodal LLMs Can Reason about Aesthetics in Zero-Shot

要約 我々は、芸術作品の美しさを評価するためにマルチモーダルLLM(MLLM)の … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | Multimodal LLMs Can Reason about Aesthetics in Zero-Shot はコメントを受け付けていません

T2V-CompBench: A Comprehensive Benchmark for Compositional Text-to-video Generation

要約 Text-to-Video (T2V) 生成モデルは大幅に進歩しましたが、 … 続きを読む

カテゴリー: cs.CV | T2V-CompBench: A Comprehensive Benchmark for Compositional Text-to-video Generation はコメントを受け付けていません

Ouroboros-Diffusion: Exploring Consistent Content Generation in Tuning-free Long Video Diffusion

要約 事前トレーニングされたテキストからビデオへのモデルに基づいて構築された先入 … 続きを読む

カテゴリー: cs.CV | Ouroboros-Diffusion: Exploring Consistent Content Generation in Tuning-free Long Video Diffusion はコメントを受け付けていません

Consistency of Responses and Continuations Generated by Large Language Models on Social Media

要約 大規模言語モデル (LLM) はテキスト生成において顕著な機能を示していま … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.HC | Consistency of Responses and Continuations Generated by Large Language Models on Social Media はコメントを受け付けていません

Evaluation of Artificial Intelligence Methods for Lead Time Prediction in Non-Cycled Areas of Automotive Production

要約 本研究では、サイクル管理されていない生産領域における未知のリードタイムを予 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Evaluation of Artificial Intelligence Methods for Lead Time Prediction in Non-Cycled Areas of Automotive Production はコメントを受け付けていません

AfriHate: A Multilingual Collection of Hate Speech and Abusive Language Datasets for African Languages

要約 ヘイトスピーチや暴言は世界的な現象であり、理解、特定、緩和するには社会文化 … 続きを読む

カテゴリー: cs.CL | AfriHate: A Multilingual Collection of Hate Speech and Abusive Language Datasets for African Languages はコメントを受け付けていません

GestLLM: Advanced Hand Gesture Interpretation via Large Language Models for Human-Robot Interaction

要約 この文書では、手のジェスチャーによる直感的なロボット制御を可能にする、人間 … 続きを読む

カテゴリー: cs.RO | GestLLM: Advanced Hand Gesture Interpretation via Large Language Models for Human-Robot Interaction はコメントを受け付けていません

KaLM-Embedding: Superior Training Data Brings A Stronger Embedding Model

要約 大規模な言語モデルでは検索拡張生成が普及するにつれて、埋め込みモデルの重要 … 続きを読む

カテゴリー: cs.CL | KaLM-Embedding: Superior Training Data Brings A Stronger Embedding Model はコメントを受け付けていません

Data-driven inventory management for new products: A warm-start and adjusted Dyna-$Q$ approach

要約 この論文では、過去の需要情報がまったくない、または限られている新発売製品の … 続きを読む

カテゴリー: cs.AI, cs.CE, cs.LG | Data-driven inventory management for new products: A warm-start and adjusted Dyna-$Q$ approach はコメントを受け付けていません