cs.AI」カテゴリーアーカイブ

DiffusionWorldViewer: Exposing and Broadening the Worldview Reflected by Generative Text-to-Image Models

要約 テキストから画像への生成(TTI)モデルは、短いテキスト記述から高品質の画 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.CY, cs.LG | DiffusionWorldViewer: Exposing and Broadening the Worldview Reflected by Generative Text-to-Image Models はコメントを受け付けていません

Multi: Multimodal Understanding Leaderboard with Text and Images

要約 マルチモーダル大規模言語モデル(MLLM)の急速な進歩は、アカデミックコミ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Multi: Multimodal Understanding Leaderboard with Text and Images はコメントを受け付けていません

Organic or Diffused: Can We Distinguish Human Art from AI-generated Images?

要約 AIによる画像生成の登場は、アートの世界を完全に破壊した。AIが生成した画 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Organic or Diffused: Can We Distinguish Human Art from AI-generated Images? はコメントを受け付けていません

IGUANe: a 3D generalizable CycleGAN for multicenter harmonization of brain MR images

要約 MRI研究では、複数の撮影部位からの画像データを集約することでサンプルサイ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | IGUANe: a 3D generalizable CycleGAN for multicenter harmonization of brain MR images はコメントを受け付けていません

SGS-SLAM: Semantic Gaussian Splatting For Neural Dense SLAM

要約 高密度同時定位マッピング(SLAM)では、意味理解が重要な役割を果たし、シ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | SGS-SLAM: Semantic Gaussian Splatting For Neural Dense SLAM はコメントを受け付けていません

CLIP Can Understand Depth

要約 CLIPの単眼奥行き推定への一般化に関する最近の研究により、ウェブクローリ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | CLIP Can Understand Depth はコメントを受け付けていません

Training-Free Consistent Text-to-Image Generation

要約 Text-to-imageモデルは、ユーザが自然言語によって画像生成プロセ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG | Training-Free Consistent Text-to-Image Generation はコメントを受け付けていません

InstanceDiffusion: Instance-level Control for Image Generation

要約 テキストから画像への拡散モデルは高品質な画像を生成するが、画像内の個々のイ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | InstanceDiffusion: Instance-level Control for Image Generation はコメントを受け付けていません

Do Diffusion Models Learn Semantically Meaningful and Efficient Representations?

要約 拡散モデルは、宇宙飛行士が月面で馬に乗り、影が適切に配置されているような、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Do Diffusion Models Learn Semantically Meaningful and Efficient Representations? はコメントを受け付けていません

V-IRL: Grounding Virtual Intelligence in Real Life

要約 人間が住む地球と、現代のAIエージェントが作られるデジタル領域との間には、 … 続きを読む

カテゴリー: cs.AI, cs.CV | V-IRL: Grounding Virtual Intelligence in Real Life はコメントを受け付けていません