cs.AI」カテゴリーアーカイブ

Title block detection and information extraction for enhanced building drawings search

要約 建築、エンジニアリング、および建設(AEC)業界は、建物の建設、メンテナン … 続きを読む

カテゴリー: cs.AI, cs.CV | Title block detection and information extraction for enhanced building drawings search はコメントを受け付けていません

Fine-Grained Retrieval-Augmented Generation for Visual Question Answering

要約 視覚的な質問回答(VQA)は、画像からの情報を利用することにより、自然言語 … 続きを読む

カテゴリー: cs.AI, cs.CV | Fine-Grained Retrieval-Augmented Generation for Visual Question Answering はコメントを受け付けていません

Seaweed-7B: Cost-Effective Training of Video Generation Foundation Model

要約 このテクニカルレポートは、ビデオジェネレーションファンデーションモデルをト … 続きを読む

カテゴリー: cs.AI, cs.CV | Seaweed-7B: Cost-Effective Training of Video Generation Foundation Model はコメントを受け付けていません

Visual Chronicles: Using Multimodal LLMs to Analyze Massive Collections of Images

要約 マルチモーダルLLMS(MLLM)を使用してシステムを提示して、時間的変化 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.CY | Visual Chronicles: Using Multimodal LLMs to Analyze Massive Collections of Images はコメントを受け付けていません

Steering CLIP’s vision transformer with sparse autoencoders

要約 ビジョンモデルは非常に有能ですが、内部メカニズムはよく理解されていません。 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Steering CLIP’s vision transformer with sparse autoencoders はコメントを受け付けていません

Pangu Ultra: Pushing the Limits of Dense Large Language Models on Ascend NPUs

要約 1,350億パラメーターとAscend Neural Processing … 続きを読む

カテゴリー: cs.AI, cs.CL | Pangu Ultra: Pushing the Limits of Dense Large Language Models on Ascend NPUs はコメントを受け付けていません

AerialVG: A Challenging Benchmark for Aerial Visual Grounding by Exploring Positional Relations

要約 Visual Grounding(VG)は、自然言語の説明に基づいて画像に … 続きを読む

カテゴリー: cs.AI, cs.CV | AerialVG: A Challenging Benchmark for Aerial Visual Grounding by Exploring Positional Relations はコメントを受け付けていません

CORTEX-AVD: A Framework for CORner Case Testing and EXploration in Autonomous Vehicle Development

要約 自律車(AVS)は、人為的エラーを減らすことにより、交通の安全性と効率を改 … 続きを読む

カテゴリー: cs.AI, cs.RO | CORTEX-AVD: A Framework for CORner Case Testing and EXploration in Autonomous Vehicle Development はコメントを受け付けていません

ChatEMG: Synthetic Data Generation to Control a Robotic Hand Orthosis for Stroke

要約 脳卒中患者の手矯正の意図は、データ収集の難しさのために困難です。 さらに、 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | ChatEMG: Synthetic Data Generation to Control a Robotic Hand Orthosis for Stroke はコメントを受け付けていません

Learning-Based Approximate Nonlinear Model Predictive Control Motion Cueing

要約 モーションキューイングアルゴリズム(MCAS)は、シミュレートされた車両の … 続きを読む

カテゴリー: cs.AI, cs.RO, cs.SY, eess.SY | Learning-Based Approximate Nonlinear Model Predictive Control Motion Cueing はコメントを受け付けていません