「cs.MM」カテゴリーアーカイブ

ALMol: Aligned Language-Molecule Translation LLMs through Offline Preference Contrastive Optimisation

投稿日: 2024年5月16日作成者: jarxiv

要約化学と人工知能 (AI) の分野は、科学的発見を加速することを目的とした活 … 続きを読む →

カテゴリー: cs.CL, cs.MM | コメントを受け付けていません

Language Models as Black-Box Optimizers for Vision-Language Models

投稿日: 2024年5月15日作成者: jarxiv

要約 Web スケールのデータセットで事前トレーニングされたビジョン言語モデル … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG, cs.MM | コメントを受け付けていません

ALMol: Aligned Language-Molecule Translation LLMs through Offline Preference Contrastive Optimisation

投稿日: 2024年5月15日作成者: jarxiv

要約化学と人工知能 (AI) の分野は、科学的発見を加速することを目的とした活 … 続きを読む →

カテゴリー: cs.CL, cs.MM | コメントを受け付けていません

Dual-Branch Network for Portrait Image Quality Assessment

投稿日: 2024年5月15日作成者: jarxiv

要約ポートレート画像は通常、さまざまな背景を背景にした際立った人物で構成されま … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

Enhancing Blind Video Quality Assessment with Rich Quality-aware Features

投稿日: 2024年5月15日作成者: jarxiv

要約このペーパーでは、ソーシャルメディアビデオのブラインドビデオ品質評価 … 続きを読む →

カテゴリー: cs.CV, cs.MM, eess.IV | コメントを受け付けていません

CinePile: A Long Video Question Answering Dataset and Benchmark

投稿日: 2024年5月15日作成者: jarxiv

要約長い形式のビデオを理解するための現在のデータセットは、ビデオから 1 つま … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.MM | コメントを受け付けていません

FastSAG: Towards Fast Non-Autoregressive Singing Accompaniment Generation

投稿日: 2024年5月14日作成者: jarxiv

要約入力ボーカルに伴奏する楽器音楽を生成する歌唱伴奏生成 (SAG) は、人間 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

MADRL-Based Rate Adaptation for 360$\degree$ Video Streaming with Multi-Viewpoint Prediction

投稿日: 2024年5月14日作成者: jarxiv

要約過去数年間で、ネットワーク上の 360$\degree$ ビデオトラフィ … 続きを読む →

カテゴリー: cs.AI, cs.MM, cs.NI, eess.IV | コメントを受け付けていません

Automatic Recognition of Food Ingestion Environment from the AIM-2 Wearable Sensor

投稿日: 2024年5月14日作成者: jarxiv

要約摂取環境の検出は、食事摂取量をモニタリングする際の重要な側面です。食事の … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM | コメントを受け付けていません

Improving Multimodal Learning with Multi-Loss Gradient Modulation

投稿日: 2024年5月14日作成者: jarxiv

要約オーディオやビデオなどの複数のモダリティから学習すると、補完的な情報を活用 … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

「cs.MM」カテゴリーアーカイブ

ALMol: Aligned Language-Molecule Translation LLMs through Offline Preference Contrastive Optimisation

Language Models as Black-Box Optimizers for Vision-Language Models

ALMol: Aligned Language-Molecule Translation LLMs through Offline Preference Contrastive Optimisation

Dual-Branch Network for Portrait Image Quality Assessment

Enhancing Blind Video Quality Assessment with Rich Quality-aware Features

CinePile: A Long Video Question Answering Dataset and Benchmark

FastSAG: Towards Fast Non-Autoregressive Singing Accompaniment Generation

MADRL-Based Rate Adaptation for 360$\degree$ Video Streaming with Multi-Viewpoint Prediction

Automatic Recognition of Food Ingestion Environment from the AIM-2 Wearable Sensor

Improving Multimodal Learning with Multi-Loss Gradient Modulation

最近の投稿

最近のコメント

アーカイブ

カテゴリー