月別アーカイブ: 2024年5月

Jina CLIP: Your CLIP Model Is Also Your Text Retriever

要約 Contrastive Language-Image Pretrainin … 続きを読む

カテゴリー: 68T50, cs.AI, cs.CL, cs.CV, cs.IR, I.2.7 | Jina CLIP: Your CLIP Model Is Also Your Text Retriever はコメントを受け付けていません

Boost Your Own Human Image Generation Model via Direct Preference Optimization with AI Feedback

要約 Text-to-Image (T2I) 手法による高品質の人物画像の生成は … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Boost Your Own Human Image Generation Model via Direct Preference Optimization with AI Feedback はコメントを受け付けていません

MOFA-Video: Controllable Image Animation via Generative Motion Field Adaptions in Frozen Image-to-Video Diffusion Model

要約 我々は、高度な制御可能な画像アニメーション手法である MOFA-Video … 続きを読む

カテゴリー: cs.AI, cs.CV | MOFA-Video: Controllable Image Animation via Generative Motion Field Adaptions in Frozen Image-to-Video Diffusion Model はコメントを受け付けていません

Image Deraining with Frequency-Enhanced State Space Model

要約 画像内の雨によるアーチファクトを除去することは、重要な問題として認識されて … 続きを読む

カテゴリー: cs.CV, eess.IV | Image Deraining with Frequency-Enhanced State Space Model はコメントを受け付けていません

KerasCV and KerasNLP: Vision and Language Power-Ups

要約 コンピューター ビジョンおよび自然言語処理ワークフロー用の Keras A … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.SE, I.2.10 | KerasCV and KerasNLP: Vision and Language Power-Ups はコメントを受け付けていません

FaceMixup: Enhancing Facial Expression Recognition through Mixed Face Regularization

要約 深層学習ソリューションの急増と、注釈付きの大規模なデータセットの不足により … 続きを読む

カテゴリー: cs.CV | FaceMixup: Enhancing Facial Expression Recognition through Mixed Face Regularization はコメントを受け付けていません

ETHER: Efficient Finetuning of Large-Scale Models with Hyperplane Reflections

要約 パラメーター効率の良い微調整 (PEFT) は、一般化機能を維持しながら基 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | ETHER: Efficient Finetuning of Large-Scale Models with Hyperplane Reflections はコメントを受け付けていません

CV-VAE: A Compatible Video VAE for Latent Generative Video Models

要約 変分オートエンコーダー (VAE) などのネットワークを利用したビデオの時 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | CV-VAE: A Compatible Video VAE for Latent Generative Video Models はコメントを受け付けていません

SemFlow: Binding Semantic Segmentation and Image Synthesis via Rectified Flow

要約 意味セグメンテーションと意味画像合成は、視覚認識と生成における 2 つの代 … 続きを読む

カテゴリー: cs.CV | SemFlow: Binding Semantic Segmentation and Image Synthesis via Rectified Flow はコメントを受け付けていません

TetSphere Splatting: Representing High-Quality Geometry with Lagrangian Volumetric Meshes

要約 高品質のジオメトリで 3D 形状を再構成するための明示的なラグランジュ表現 … 続きを読む

カテゴリー: cs.CV, cs.GR | TetSphere Splatting: Representing High-Quality Geometry with Lagrangian Volumetric Meshes はコメントを受け付けていません