cs.AI」カテゴリーアーカイブ

Baichuan-Omni Technical Report

要約 GPT-4o の顕著なマルチモーダル機能とインタラクティブなエクスペリエン … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Baichuan-Omni Technical Report はコメントを受け付けていません

A Large-scale Interpretable Multi-modality Benchmark for Facial Image Forgery Localization

要約 画像内の改ざんされたピクセルを特定することに重点を置いた画像偽造位置特定は … 続きを読む

カテゴリー: cs.AI, cs.CV | A Large-scale Interpretable Multi-modality Benchmark for Facial Image Forgery Localization はコメントを受け付けていません

A Review on the Integration of Artificial Intelligence and Medical Imaging in IVF Ovarian Stimulation

要約 人工知能 (AI) は、体外受精 (IVF) における意思決定を強化し、治 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | A Review on the Integration of Artificial Intelligence and Medical Imaging in IVF Ovarian Stimulation はコメントを受け付けていません

OS-Genesis: Automating GUI Agent Trajectory Construction via Reverse Task Synthesis

要約 ビジョン言語モデル (VLM) を活用したグラフィカル ユーザー インター … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.HC | OS-Genesis: Automating GUI Agent Trajectory Construction via Reverse Task Synthesis はコメントを受け付けていません

LongDocURL: a Comprehensive Multimodal Long Document Benchmark Integrating Understanding, Reasoning, and Locating

要約 ラージ ビジョン言語モデル (LVLM) は文書理解機能を大幅に向上させ、 … 続きを読む

カテゴリー: cs.AI, cs.CL | LongDocURL: a Comprehensive Multimodal Long Document Benchmark Integrating Understanding, Reasoning, and Locating はコメントを受け付けていません

TableRAG: Million-Token Table Understanding with Language Models

要約 言語モデル (LM) の最近の進歩により、主に表を操作および分析するプログ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR, cs.LG | TableRAG: Million-Token Table Understanding with Language Models はコメントを受け付けていません

ChaI-TeA: A Benchmark for Evaluating Autocompletion of Interactions with LLM-based Chatbots

要約 LLM の台頭により、人間とコンピューターのやり取りの一部が LLM ベー … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | ChaI-TeA: A Benchmark for Evaluating Autocompletion of Interactions with LLM-based Chatbots はコメントを受け付けていません

SoK: On the Offensive Potential of AI

要約 私たちの社会は人工知能 (AI) の恩恵をますます受けています。 残念なこ … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.CY, cs.LG | SoK: On the Offensive Potential of AI はコメントを受け付けていません

RDPM: Solve Diffusion Probabilistic Models via Recurrent Token Prediction

要約 拡散確率モデル (DPM) は、高忠実度画像合成の事実上のアプローチとして … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | RDPM: Solve Diffusion Probabilistic Models via Recurrent Token Prediction はコメントを受け付けていません

Causal Composition Diffusion Model for Closed-loop Traffic Generation

要約 シミュレーションは、自動運転における安全性評価、特に複雑なインタラクティブ … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Causal Composition Diffusion Model for Closed-loop Traffic Generation はコメントを受け付けていません