月別アーカイブ: 2024年1月

Linear Spaces of Meanings: Compositional Structures in Vision-Language Models

投稿日: 2024年1月12日作成者: jarxiv

要約私たちは、事前にトレーニングされたビジョン言語モデル (VLM) からデー … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

PALP: Prompt Aligned Personalization of Text-to-Image Models

投稿日: 2024年1月12日作成者: jarxiv

要約コンテンツ作成者は多くの場合、従来のテキストから画像へのモデルの機能を超え … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.GR, cs.LG | コメントを受け付けていません

Crossway Diffusion: Improving Diffusion-based Visuomotor Policy via Self-supervised Learning

投稿日: 2024年1月12日作成者: jarxiv

要約シーケンスモデリングのアプローチは、ロボットの模倣学習において有望な結果 … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Gaussian Shadow Casting for Neural Characters

投稿日: 2024年1月12日作成者: jarxiv

要約ニューラルキャラクターモデルは、ビデオから詳細なジオメトリとテクスチャ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Manipulating Feature Visualizations with Gradient Slingshots

投稿日: 2024年1月12日作成者: jarxiv

要約ディープニューラルネットワーク (DNN) は、複雑で多彩な表現を学習 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Dubbing for Everyone: Data-Efficient Visual Dubbing using Neural Rendering Priors

投稿日: 2024年1月12日作成者: jarxiv

要約ビジュアルダビングは、ビデオ内の俳優の唇の動きを生成して、指定されたオーデ … 続きを読む →

カテゴリー: cs.CV, cs.GR | コメントを受け付けていません

E$^{2}$GAN: Efficient Training of Efficient GANs for Image-to-Image Translation

投稿日: 2024年1月12日作成者: jarxiv

要約柔軟なリアルタイムのオンデバイス画像編集を可能にする非常に有望な方向性の … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Distilling Vision-Language Models on Millions of Videos

投稿日: 2024年1月12日作成者: jarxiv

要約視覚言語モデルの最近の進歩は、豊富な画像テキストデータに大きく起因してい … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Language-based Valence and Arousal Expressions between the United States and China: a Cross-Cultural Examination

投稿日: 2024年1月12日作成者: jarxiv

要約個人の感情表現はソーシャルメディアを使用して広範囲に研究されていますが、 … 続きを読む →

カテゴリー: cs.CL, cs.CY | コメントを受け付けていません

RoSA: Accurate Parameter-Efficient Fine-Tuning via Robust Adaptation

投稿日: 2024年1月12日作成者: jarxiv

要約私たちは、大規模言語モデル (LLM) のコンテキストで限られた計算量とメ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

月別アーカイブ: 2024年1月

Linear Spaces of Meanings: Compositional Structures in Vision-Language Models

PALP: Prompt Aligned Personalization of Text-to-Image Models

Crossway Diffusion: Improving Diffusion-based Visuomotor Policy via Self-supervised Learning

Gaussian Shadow Casting for Neural Characters

Manipulating Feature Visualizations with Gradient Slingshots

Dubbing for Everyone: Data-Efficient Visual Dubbing using Neural Rendering Priors

E$^{2}$GAN: Efficient Training of Efficient GANs for Image-to-Image Translation

Distilling Vision-Language Models on Millions of Videos

Language-based Valence and Arousal Expressions between the United States and China: a Cross-Cultural Examination

RoSA: Accurate Parameter-Efficient Fine-Tuning via Robust Adaptation

最近の投稿

最近のコメント

アーカイブ

カテゴリー