投稿者「jarxiv」のアーカイブ

Automated Measurement of Eczema Severity with Self-Supervised Learning

要約 デジタルカメラから取得した画像を使用した湿疹の自動診断により、個人は回復を … 続きを読む

カテゴリー: cs.CV, cs.LG | Automated Measurement of Eczema Severity with Self-Supervised Learning はコメントを受け付けていません

Zero-Shot, But at What Cost? Unveiling the Hidden Overhead of MILS’s LLM-CLIP Framework for Image Captioning

要約 MILS(Multimodal Iterative LLM Solver) … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.PF | Zero-Shot, But at What Cost? Unveiling the Hidden Overhead of MILS’s LLM-CLIP Framework for Image Captioning はコメントを受け付けていません

DreamDistribution: Learning Prompt Distribution for Diverse In-distribution Generation

要約 テキストからイメージ(T2I)拡散モデルの普及により、テキストの説明から高 … 続きを読む

カテゴリー: cs.CV | DreamDistribution: Learning Prompt Distribution for Diverse In-distribution Generation はコメントを受け付けていません

Shape-Guided Clothing Warping for Virtual Try-On

要約 画像ベースのVirtual Try-Onは、ポーズの一貫性を維持しながら、 … 続きを読む

カテゴリー: cs.CV | Shape-Guided Clothing Warping for Virtual Try-On はコメントを受け付けていません

SuoiAI: Building a Dataset for Aquatic Invertebrates in Vietnam

要約 生態学的健康と保全の取り組みにとって、水生生物多様性の理解と監視が重要です … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | SuoiAI: Building a Dataset for Aquatic Invertebrates in Vietnam はコメントを受け付けていません

Bringing Diversity from Diffusion Models to Semantic-Guided Face Asset Generation

要約 デジタルモデリングと人間の顔の再構築は、さまざまなアプリケーションに役立ち … 続きを読む

カテゴリー: cs.AI, cs.CV | Bringing Diversity from Diffusion Models to Semantic-Guided Face Asset Generation はコメントを受け付けていません

Revealing the 3D Cosmic Web through Gravitationally Constrained Neural Fields

要約 弱い重力レンズは、主に宇宙の暗黒物質の重力効果によって引き起こされる銀河形 … 続きを読む

カテゴリー: astro-ph.CO, cs.CV | Revealing the 3D Cosmic Web through Gravitationally Constrained Neural Fields はコメントを受け付けていません

Diffusion Bridge Models for 3D Medical Image Translation

要約 拡散テンソルイメージング(DTI)は、人間の脳の微細構造に関する重要な洞察 … 続きを読む

カテゴリー: cs.CV | Diffusion Bridge Models for 3D Medical Image Translation はコメントを受け付けていません

An LMM for Efficient Video Understanding via Reinforced Compression of Video Cubes

要約 大規模なマルチモーダルモデル(LMM)は、ビデオフレームを均一に知覚し、本 … 続きを読む

カテゴリー: cs.CL, cs.CV | An LMM for Efficient Video Understanding via Reinforced Compression of Video Cubes はコメントを受け付けていません

Eagle 2.5: Boosting Long-Context Post-Training for Frontier Vision-Language Models

要約 長いコンテキストマルチモーダル学習のために、フロンティアビジョンモデル(V … 続きを読む

カテゴリー: cs.CV | Eagle 2.5: Boosting Long-Context Post-Training for Frontier Vision-Language Models はコメントを受け付けていません