cs.AI」カテゴリーアーカイブ

VisRAG: Vision-based Retrieval-augmented Generation on Multi-modality Documents

要約 検索拡張生成 (RAG) は、大規模言語モデル (LLM) が外部の知識ソ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.IR | VisRAG: Vision-based Retrieval-augmented Generation on Multi-modality Documents はコメントを受け付けていません

BrainMVP: Multi-modal Vision Pre-training for Brain Image Analysis using Multi-parametric MRI

要約 脳異常の正確な診断は、相補的なマルチパラメトリック MRI 画像データを含 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | BrainMVP: Multi-modal Vision Pre-training for Brain Image Analysis using Multi-parametric MRI はコメントを受け付けていません

AR-TTA: A Simple Method for Real-World Continual Test-Time Adaptation

要約 テスト時の適応は、ソース モデルが監視なしでデータ分布の変化に適応できるよ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | AR-TTA: A Simple Method for Real-World Continual Test-Time Adaptation はコメントを受け付けていません

Transforming Game Play: A Comparative Study of DCQN and DTQN Architectures in Reinforcement Learning

要約 この研究では、3 つの異なる Atari ゲームにわたって畳み込みニューラ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Transforming Game Play: A Comparative Study of DCQN and DTQN Architectures in Reinforcement Learning はコメントを受け付けていません

Enhancing Performance of Point Cloud Completion Networks with Consistency Loss

要約 点群補完ネットワークは従来、完成した点群と対応するグラウンドトゥルース間の … 続きを読む

カテゴリー: cs.AI, cs.CV | Enhancing Performance of Point Cloud Completion Networks with Consistency Loss はコメントを受け付けていません

Early Diagnoses of Acute Lymphoblastic Leukemia Using YOLOv8 and YOLOv11 Deep Learning Models

要約 白血病だけでも毎年何千人もの人が亡くなっています。 この研究では、年間多数 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Early Diagnoses of Acute Lymphoblastic Leukemia Using YOLOv8 and YOLOv11 Deep Learning Models はコメントを受け付けていません

Deep Compression Autoencoder for Efficient High-Resolution Diffusion Models

要約 高解像度拡散モデルを加速するための新しいオートエンコーダー モデル ファミ … 続きを読む

カテゴリー: cs.AI, cs.CV | Deep Compression Autoencoder for Efficient High-Resolution Diffusion Models はコメントを受け付けていません

DrivingDojo Dataset: Advancing Interactive and Knowledge-Enriched Driving World Model

要約 ドライビング ワールド モデルは、複雑な物理ダイナミクスをモデル化できるた … 続きを読む

カテゴリー: cs.AI, cs.CV | DrivingDojo Dataset: Advancing Interactive and Knowledge-Enriched Driving World Model はコメントを受け付けていません

FlexGen: Flexible Multi-View Generation from Text and Image Inputs

要約 この研究では、単一ビュー画像、テキスト プロンプト、またはその両方を条件と … 続きを読む

カテゴリー: cs.AI, cs.CV | FlexGen: Flexible Multi-View Generation from Text and Image Inputs はコメントを受け付けていません

Adaptive Diffusion Terrain Generator for Autonomous Uneven Terrain Navigation

要約 モデルフリーの強化学習は、複雑で構造化されていない地形をナビゲートできる堅 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Adaptive Diffusion Terrain Generator for Autonomous Uneven Terrain Navigation はコメントを受け付けていません