月別アーカイブ: 2025年3月

CalibRefine: Deep Learning-Based Online Automatic Targetless LiDAR-Camera Calibration with Iterative and Attention-Driven Post-Refinement

要約 正確なマルチセンサーキャリブレーションは、自律運転、ロボット工学、インテリ … 続きを読む

カテゴリー: cs.CV, cs.SY, eess.SY | CalibRefine: Deep Learning-Based Online Automatic Targetless LiDAR-Camera Calibration with Iterative and Attention-Driven Post-Refinement はコメントを受け付けていません

In-Depth Analysis of Automated Acne Disease Recognition and Classification

要約 顔のにきびは、特に青少年の間で一般的な病気であり、身体的および心理的に悪影 … 続きを読む

カテゴリー: cs.CV | In-Depth Analysis of Automated Acne Disease Recognition and Classification はコメントを受け付けていません

Boltzmann Attention Sampling for Image Analysis with Small Objects

要約 肺結節や腫瘍病変などの小さなオブジェクトの検出とセグメント化は、画像分析に … 続きを読む

カテゴリー: cs.CV | Boltzmann Attention Sampling for Image Analysis with Small Objects はコメントを受け付けていません

Multimodal Deep Learning for Subtype Classification in Breast Cancer Using Histopathological Images and Gene Expression Data

要約 乳がんの分子サブタイピングは、個別化された治療と予後に不可欠です。 従来の … 続きを読む

カテゴリー: cs.AI, cs.CV | Multimodal Deep Learning for Subtype Classification in Breast Cancer Using Histopathological Images and Gene Expression Data はコメントを受け付けていません

CADDI: An in-Class Activity Detection Dataset using IMU data from low-cost sensors

要約 クラス内の学生活動の監視と予測は、エンゲージメントの理解と教育的有効性の向 … 続きを読む

カテゴリー: cs.CV, cs.HC | CADDI: An in-Class Activity Detection Dataset using IMU data from low-cost sensors はコメントを受け付けていません

Deepfake-Eval-2024: A Multi-Modal In-the-Wild Benchmark of Deepfakes Circulated in 2024

要約 ますます現実的に生成されるAIの時代には、詐欺と偽情報を緩和するためには、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.CY | Deepfake-Eval-2024: A Multi-Modal In-the-Wild Benchmark of Deepfakes Circulated in 2024 はコメントを受け付けていません

VOILA: Evaluation of MLLMs For Perceptual Understanding and Analogical Reasoning

要約 マルチモーダル大手言語モデル(MLLM)は、視覚情報とテキスト情報を統合す … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | VOILA: Evaluation of MLLMs For Perceptual Understanding and Analogical Reasoning はコメントを受け付けていません

VILA-M3: Enhancing Vision-Language Models with Medical Expert Knowledge

要約 Generalist Vision Language Models(VLM … 続きを読む

カテゴリー: cs.CV | VILA-M3: Enhancing Vision-Language Models with Medical Expert Knowledge はコメントを受け付けていません

SPIDER: A Comprehensive Multi-Organ Supervised Pathology Dataset and Baseline Models

要約 計算病理学でAIを進めるには、大規模で高品質で多様なデータセットが必要です … 続きを読む

カテゴリー: cs.CV, eess.IV | SPIDER: A Comprehensive Multi-Organ Supervised Pathology Dataset and Baseline Models はコメントを受け付けていません

ARINAR: Bi-Level Autoregressive Feature-by-Feature Generative Models

要約 既存の自己回帰(AR)画像生成モデルは、トークンごとの生成スキーマを使用し … 続きを読む

カテゴリー: cs.CV | ARINAR: Bi-Level Autoregressive Feature-by-Feature Generative Models はコメントを受け付けていません