月別アーカイブ: 2024年1月

Linear Spaces of Meanings: Compositional Structures in Vision-Language Models

要約 私たちは、事前にトレーニングされたビジョン言語モデル (VLM) からデー … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Linear Spaces of Meanings: Compositional Structures in Vision-Language Models はコメントを受け付けていません

PALP: Prompt Aligned Personalization of Text-to-Image Models

要約 コンテンツ作成者は多くの場合、従来のテキストから画像へのモデルの機能を超え … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.GR, cs.LG | PALP: Prompt Aligned Personalization of Text-to-Image Models はコメントを受け付けていません

Crossway Diffusion: Improving Diffusion-based Visuomotor Policy via Self-supervised Learning

要約 シーケンス モデリングのアプローチは、ロボットの模倣学習において有望な結果 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Crossway Diffusion: Improving Diffusion-based Visuomotor Policy via Self-supervised Learning はコメントを受け付けていません

Gaussian Shadow Casting for Neural Characters

要約 ニューラル キャラクター モデルは、ビデオから詳細なジオメトリとテクスチャ … 続きを読む

カテゴリー: cs.CV | Gaussian Shadow Casting for Neural Characters はコメントを受け付けていません

Manipulating Feature Visualizations with Gradient Slingshots

要約 ディープ ニューラル ネットワーク (DNN) は、複雑で多彩な表現を学習 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Manipulating Feature Visualizations with Gradient Slingshots はコメントを受け付けていません

Dubbing for Everyone: Data-Efficient Visual Dubbing using Neural Rendering Priors

要約 ビジュアルダビングは、ビデオ内の俳優の唇の動きを生成して、指定されたオーデ … 続きを読む

カテゴリー: cs.CV, cs.GR | Dubbing for Everyone: Data-Efficient Visual Dubbing using Neural Rendering Priors はコメントを受け付けていません

E$^{2}$GAN: Efficient Training of Efficient GANs for Image-to-Image Translation

要約 柔軟なリアルタイムのオンデバイス画像編集を可能にする非常に有望な方向性の … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | E$^{2}$GAN: Efficient Training of Efficient GANs for Image-to-Image Translation はコメントを受け付けていません

Distilling Vision-Language Models on Millions of Videos

要約 視覚言語モデルの最近の進歩は、豊富な画像テキスト データに大きく起因してい … 続きを読む

カテゴリー: cs.CV | Distilling Vision-Language Models on Millions of Videos はコメントを受け付けていません

Language-based Valence and Arousal Expressions between the United States and China: a Cross-Cultural Examination

要約 個人の感情表現はソーシャル メディアを使用して広範囲に研究されていますが、 … 続きを読む

カテゴリー: cs.CL, cs.CY | Language-based Valence and Arousal Expressions between the United States and China: a Cross-Cultural Examination はコメントを受け付けていません

RoSA: Accurate Parameter-Efficient Fine-Tuning via Robust Adaptation

要約 私たちは、大規模言語モデル (LLM) のコンテキストで限られた計算量とメ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | RoSA: Accurate Parameter-Efficient Fine-Tuning via Robust Adaptation はコメントを受け付けていません