月別アーカイブ: 2023年6月

Kosmos-2: Grounding Multimodal Large Language Models to the World

要約 私たちは、マルチモーダル大規模言語モデル (MLLM) である Kosmo … 続きを読む

カテゴリー: cs.CL, cs.CV | Kosmos-2: Grounding Multimodal Large Language Models to the World はコメントを受け付けていません

A Flyweight CNN with Adaptive Decoder for Schistosoma mansoni Egg Detection

要約 マンソン住血吸虫症は、70 か国以上で流行している寄生虫症であり、その診断 … 続きを読む

カテゴリー: cs.CV, eess.IV | A Flyweight CNN with Adaptive Decoder for Schistosoma mansoni Egg Detection はコメントを受け付けていません

ViNT: A Foundation Model for Visual Navigation

要約 汎用の事前トレーニング済みモデル (「基礎モデル」) により、専門家は、ゼ … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | ViNT: A Foundation Model for Visual Navigation はコメントを受け付けていません

Single-Stage Diffusion NeRF: A Unified Approach to 3D Generation and Reconstruction

要約 3D 対応の画像合成には、画像からのシーン生成や新しいビューの合成など、さ … 続きを読む

カテゴリー: cs.CV | Single-Stage Diffusion NeRF: A Unified Approach to 3D Generation and Reconstruction はコメントを受け付けていません

Infinite Photorealistic Worlds using Procedural Generation

要約 自然界のフォトリアリスティックな 3D シーンのプロシージャル ジェネレー … 続きを読む

カテゴリー: cs.CV | Infinite Photorealistic Worlds using Procedural Generation はコメントを受け付けていません

Multiface: A Dataset for Neural Face Rendering

要約 人間の顔のフォトリアリスティックなアバターは近年大きな進歩を遂げていますが … 続きを読む

カテゴリー: cs.CV, cs.GR | Multiface: A Dataset for Neural Face Rendering はコメントを受け付けていません

A Fully Unsupervised Instance Segmentation Technique for White Blood Cell Images

要約 白血球としても知られる白血球は、顕著な免疫系細胞として機能する不均一な核を … 続きを読む

カテゴリー: cs.CV, eess.IV | A Fully Unsupervised Instance Segmentation Technique for White Blood Cell Images はコメントを受け付けていません

Restart Sampling for Improving Generative Processes

要約 拡散モデルなどの微分方程式を解くことを伴う生成プロセスでは、速度と品質のバ … 続きを読む

カテゴリー: cs.CV, cs.LG, stat.CO, stat.ML | Restart Sampling for Improving Generative Processes はコメントを受け付けていません

Domain-Scalable Unpaired Image Translation via Latent Space Anchoring

要約 Unpaired image-to-image translation ( … 続きを読む

カテゴリー: cs.CV | Domain-Scalable Unpaired Image Translation via Latent Space Anchoring はコメントを受け付けていません

DreamSim: Learning New Dimensions of Human Visual Similarity using Synthetic Data

要約 現在の知覚的類似性メトリクスは、ピクセルとパッチのレベルで機能します。 こ … 続きを読む

カテゴリー: cs.CV, cs.LG | DreamSim: Learning New Dimensions of Human Visual Similarity using Synthetic Data はコメントを受け付けていません