月別アーカイブ: 2023年5月

Progressive Learning of 3D Reconstruction Network from 2D GAN Data

要約 この論文では、単一の画像から高品質のテクスチャ付き 3D モデルを再構成す … 続きを読む

カテゴリー: cs.CV | Progressive Learning of 3D Reconstruction Network from 2D GAN Data はコメントを受け付けていません

LLMScore: Unveiling the Power of Large Language Models in Text-to-Image Synthesis Evaluation

要約 テキストと画像の合成に関する既存の自動評価では、オブジェクトレベルの構成性 … 続きを読む

カテゴリー: cs.CL, cs.CV | LLMScore: Unveiling the Power of Large Language Models in Text-to-Image Synthesis Evaluation はコメントを受け付けていません

Skin Lesion Diagnosis Using Convolutional Neural Networks

要約 癌性皮膚病変は人間で最もよく検出される悪性腫瘍の 1 つであり、早期に検出 … 続きを読む

カテゴリー: cs.CV, eess.IV | Skin Lesion Diagnosis Using Convolutional Neural Networks はコメントを受け付けていません

LMEye: An Interactive Perception Network for Large Language Models

要約 GPT-4 のように、Large Visual Language Mode … 続きを読む

カテゴリー: cs.AI, cs.CV | LMEye: An Interactive Perception Network for Large Language Models はコメントを受け付けていません

UniControl: A Unified Diffusion Model for Controllable Visual Generation In the Wild

要約 機械の自律性と人間による制御の実現は、対話型 AI システムの設計において … 続きを読む

カテゴリー: cs.AI, cs.CV | UniControl: A Unified Diffusion Model for Controllable Visual Generation In the Wild はコメントを受け付けていません

MVPSNet: Fast Generalizable Multi-view Photometric Stereo

要約 私たちは、MVPSNet と呼ばれる、マルチビュー フォトメトリック ステ … 続きを読む

カテゴリー: cs.CV | MVPSNet: Fast Generalizable Multi-view Photometric Stereo はコメントを受け付けていません

ONE-PEACE: Exploring One General Representation Model Toward Unlimited Modalities

要約 この研究では、無制限のモダリティに向けた一般表現モデルを構築するためのスケ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.SD, eess.AS | ONE-PEACE: Exploring One General Representation Model Toward Unlimited Modalities はコメントを受け付けていません

Going Denser with Open-Vocabulary Part Segmentation

要約 物体検出は、限られた数のカテゴリからオープンな語彙に拡張されました。 今後 … 続きを読む

カテゴリー: cs.CV | Going Denser with Open-Vocabulary Part Segmentation はコメントを受け付けていません

VisionLLM: Large Language Model is also an Open-Ended Decoder for Vision-Centric Tasks

要約 大規模言語モデル (LLM) は、ユーザーに合わせたタスクに対する優れたゼ … 続きを読む

カテゴリー: cs.CV | VisionLLM: Large Language Model is also an Open-Ended Decoder for Vision-Centric Tasks はコメントを受け付けていません

Motion Planning (In)feasibility Detection using a Prior Roadmap via Path and Cut Search

要約 動作計画では、環境内で可能なすべてのロボット構成を表す構成空間 (C 空間 … 続きを読む

カテゴリー: cs.RO | Motion Planning (In)feasibility Detection using a Prior Roadmap via Path and Cut Search はコメントを受け付けていません