cs.AI」カテゴリーアーカイブ

Everyone Can Be Picasso? A Computational Framework into the Myth of Human versus AI Painting

要約 最近の AI テクノロジー、特に AI 生成コンテンツ (AIGC) の進 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.HC, H.5.2 | Everyone Can Be Picasso? A Computational Framework into the Myth of Human versus AI Painting はコメントを受け付けていません

RoboScript: Code Generation for Free-Form Manipulation Tasks across Real and Simulation

要約 オープンワールドのロボット操作のための高レベルのタスク計画とコード生成の急 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.RO, I.2.10 | RoboScript: Code Generation for Free-Form Manipulation Tasks across Real and Simulation はコメントを受け付けていません

Tables as Images? Exploring the Strengths and Limitations of LLMs on Multimodal Representations of Tabular Data

要約 このペーパーでは、さまざまなプロンプト戦略とデータ形式を通じて表形式データ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Tables as Images? Exploring the Strengths and Limitations of LLMs on Multimodal Representations of Tabular Data はコメントを受け付けていません

Visual Hallucinations of Multi-modal Large Language Models

要約 幻視 (VH) とは、マルチモーダル LLM (MLLM) が視覚的な質問 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Visual Hallucinations of Multi-modal Large Language Models はコメントを受け付けていません

Mitigating Gender Bias in Face Recognition Using the von Mises-Fisher Mixture Model

要約 日常の幅広い用途における深層学習アルゴリズムの高いパフォーマンスと信頼性に … 続きを読む

カテゴリー: cs.AI, cs.CV | Mitigating Gender Bias in Face Recognition Using the von Mises-Fisher Mixture Model はコメントを受け付けていません

Snap Video: Scaled Spatiotemporal Transformers for Text-to-Video Synthesis

要約 画像を生成するための現代のモデルは、驚くべき品質と多用途性を示しています。 … 続きを読む

カテゴリー: cs.AI, cs.CV | Snap Video: Scaled Spatiotemporal Transformers for Text-to-Video Synthesis はコメントを受け付けていません

Measuring Multimodal Mathematical Reasoning with MATH-Vision Dataset

要約 大規模マルチモーダル モデル (LMM) の最近の進歩により、MathVi … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, math.HO | Measuring Multimodal Mathematical Reasoning with MATH-Vision Dataset はコメントを受け付けていません

AesFA: An Aesthetic Feature-Aware Arbitrary Neural Style Transfer

要約 ニューラル スタイル トランスファー (NST) は近年大幅に進化しました … 続きを読む

カテゴリー: cs.AI, cs.CV | AesFA: An Aesthetic Feature-Aware Arbitrary Neural Style Transfer はコメントを受け付けていません

GeneOH Diffusion: Towards Generalizable Hand-Object Interaction Denoising via Denoising Diffusion

要約 この研究では、手とオブジェクトのインタラクション (HOI) のノイズを除 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG | GeneOH Diffusion: Towards Generalizable Hand-Object Interaction Denoising via Denoising Diffusion はコメントを受け付けていません

WeakSAM: Segment Anything Meets Weakly-supervised Instance-level Recognition

要約 不正確な監視を使用した弱い監視による視覚認識は、重要かつ困難な学習問題です … 続きを読む

カテゴリー: cs.AI, cs.CV | WeakSAM: Segment Anything Meets Weakly-supervised Instance-level Recognition はコメントを受け付けていません