月別アーカイブ: 2024年4月

RadRotator: 3D Rotation of Radiographs with Diffusion Models

要約 2 次元 (2D) イメージを 3 次元 (3D) ボリュームに変換するこ … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | RadRotator: 3D Rotation of Radiographs with Diffusion Models はコメントを受け付けていません

Towards Robust Ferrous Scrap Material Classification with Deep Learning and Conformal Prediction

要約 鉄鋼生産分野では、鉄スクラップのリサイクルはエネルギー消費と温室効果ガス排 … 続きを読む

カテゴリー: cs.CV, cs.LG | Towards Robust Ferrous Scrap Material Classification with Deep Learning and Conformal Prediction はコメントを受け付けていません

Groma: Localized Visual Tokenization for Grounding Multimodal Large Language Models

要約 根拠があり、きめ細かい視覚認識能力を備えたマルチモーダル大規模言語モデル … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Groma: Localized Visual Tokenization for Grounding Multimodal Large Language Models はコメントを受け付けていません

Optimizing Calibration by Gaining Aware of Prediction Correctness

要約 モデルのキャリブレーションは、信頼性と予測の正確さを一致させることを目的と … 続きを読む

カテゴリー: cs.CV, cs.LG, stat.ML | Optimizing Calibration by Gaining Aware of Prediction Correctness はコメントを受け付けていません

BANF: Band-limited Neural Fields for Levels of Detail Reconstruction

要約 主にその暗黙的な性質により、離散信号処理からのフーリエ解析がこれらの表現に … 続きを読む

カテゴリー: cs.CV, eess.IV | BANF: Band-limited Neural Fields for Levels of Detail Reconstruction はコメントを受け付けていません

PhysDreamer: Physics-Based Interaction with 3D Objects via Video Generation

要約 現実的なオブジェクトのインタラクションは、没入型の仮想体験を作成するために … 続きを読む

カテゴリー: cs.AI, cs.CV | PhysDreamer: Physics-Based Interaction with 3D Objects via Video Generation はコメントを受け付けていません

LaPA: Latent Prompt Assist Model For Medical Visual Question Answering

要約 Medical Visual Question Answering (Me … 続きを読む

カテゴリー: cs.CL, cs.CV | LaPA: Latent Prompt Assist Model For Medical Visual Question Answering はコメントを受け付けていません

Analysis of Classifier-Free Guidance Weight Schedulers

要約 Classifier-Free Guide (CFG) は、テキストから画 … 続きを読む

カテゴリー: cs.CV, cs.LG | Analysis of Classifier-Free Guidance Weight Schedulers はコメントを受け付けていません

Data Alignment for Zero-Shot Concept Generation in Dermatology AI

要約 皮膚科における AI は急速に進化していますが、信頼できる分類器をトレーニ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | Data Alignment for Zero-Shot Concept Generation in Dermatology AI はコメントを受け付けていません

Unified Scene Representation and Reconstruction for 3D Large Language Models

要約 大規模言語モデル (LLM) が 3D 環境と対話できるようにすることは困 … 続きを読む

カテゴリー: cs.CV | Unified Scene Representation and Reconstruction for 3D Large Language Models はコメントを受け付けていません