cs.AI」カテゴリーアーカイブ

HVI: A New color space for Low-light Image Enhancement

要約 Low-light Image Enhancement(LLIE)は、破損 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | HVI: A New color space for Low-light Image Enhancement はコメントを受け付けていません

Explainable, Multi-modal Wound Infection Classification from Images Augmented with Generated Captions

要約 糖尿病の足潰瘍(DFU)の感染症は、組織死や四肢切断を含む重度の合併症を引 … 続きを読む

カテゴリー: cs.AI, cs.CV | Explainable, Multi-modal Wound Infection Classification from Images Augmented with Generated Captions はコメントを受け付けていません

Judge a Book by its Cover: Investigating Multi-Modal LLMs for Multi-Page Handwritten Document Transcription

要約 手書きのテキスト認識(HTR)は、特にページが共通のフォーマットとコンテキ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Judge a Book by its Cover: Investigating Multi-Modal LLMs for Multi-Page Handwritten Document Transcription はコメントを受け付けていません

M^3Builder: A Multi-Agent System for Automated Machine Learning in Medical Imaging

要約 エージェントAIシステムは、複雑なタスクを自律的に実行する能力について大き … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | M^3Builder: A Multi-Agent System for Automated Machine Learning in Medical Imaging はコメントを受け付けていません

Multi-Scale Neighborhood Occupancy Masked Autoencoder for Self-Supervised Learning in LiDAR Point Clouds

要約 Masked Autoencoders(MAE)は、ビジョンおよびそれ以降 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Multi-Scale Neighborhood Occupancy Masked Autoencoder for Self-Supervised Learning in LiDAR Point Clouds はコメントを受け付けていません

UniTok: A Unified Tokenizer for Visual Generation and Understanding

要約 視覚生成と理解の間の表現の格差は、これらの機能を単一のフレームワークに統合 … 続きを読む

カテゴリー: cs.AI, cs.CV | UniTok: A Unified Tokenizer for Visual Generation and Understanding はコメントを受け付けていません

G3Flow: Generative 3D Semantic Flow for Pose-aware and Generalizable Object Manipulation

要約 3Dロボット操作のための模倣学習の最近の進歩により、拡散ベースのポリシーで … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO, cs.SY, eess.SY | G3Flow: Generative 3D Semantic Flow for Pose-aware and Generalizable Object Manipulation はコメントを受け付けていません

A Unifying Information-theoretic Perspective on Evaluating Generative Models

要約 生成モデルの出力を解釈することの難しさを考慮すると、意味のある評価メトリッ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | A Unifying Information-theoretic Perspective on Evaluating Generative Models はコメントを受け付けていません

Walking the Web of Concept-Class Relationships in Incrementally Trained Interpretable Models

要約 概念ベースの方法は、標準的な監視設定で解釈可能なニューラルネットワークを開 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Walking the Web of Concept-Class Relationships in Incrementally Trained Interpretable Models はコメントを受け付けていません

Sim-to-Real Reinforcement Learning for Vision-Based Dexterous Manipulation on Humanoids

要約 強化学習は、多様な問題ドメイン全体で人間または超人レベルの能力を達成するた … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO, cs.SY, eess.SY | Sim-to-Real Reinforcement Learning for Vision-Based Dexterous Manipulation on Humanoids はコメントを受け付けていません