cs.MM」カテゴリーアーカイブ

Language Models as Black-Box Optimizers for Vision-Language Models

要約 Web スケールのデータセットで事前トレーニングされたビジョン言語モデル … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG, cs.MM | Language Models as Black-Box Optimizers for Vision-Language Models はコメントを受け付けていません

ALMol: Aligned Language-Molecule Translation LLMs through Offline Preference Contrastive Optimisation

要約 化学と人工知能 (AI) の分野は、科学的発見を加速することを目的とした活 … 続きを読む

カテゴリー: cs.CL, cs.MM | ALMol: Aligned Language-Molecule Translation LLMs through Offline Preference Contrastive Optimisation はコメントを受け付けていません

Dual-Branch Network for Portrait Image Quality Assessment

要約 ポートレート画像は通常、さまざまな背景を背景にした際立った人物で構成されま … 続きを読む

カテゴリー: cs.CV, cs.MM | Dual-Branch Network for Portrait Image Quality Assessment はコメントを受け付けていません

Enhancing Blind Video Quality Assessment with Rich Quality-aware Features

要約 このペーパーでは、ソーシャル メディア ビデオのブラインド ビデオ品質評価 … 続きを読む

カテゴリー: cs.CV, cs.MM, eess.IV | Enhancing Blind Video Quality Assessment with Rich Quality-aware Features はコメントを受け付けていません

CinePile: A Long Video Question Answering Dataset and Benchmark

要約 長い形式のビデオを理解するための現在のデータセットは、ビデオから 1 つま … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.MM | CinePile: A Long Video Question Answering Dataset and Benchmark はコメントを受け付けていません

FastSAG: Towards Fast Non-Autoregressive Singing Accompaniment Generation

要約 入力ボーカルに伴奏する楽器音楽を生成する歌唱伴奏生成 (SAG) は、人間 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.MM, cs.SD, eess.AS | FastSAG: Towards Fast Non-Autoregressive Singing Accompaniment Generation はコメントを受け付けていません

MADRL-Based Rate Adaptation for 360$\degree$ Video Streaming with Multi-Viewpoint Prediction

要約 過去数年間で、ネットワーク上の 360$\degree$ ビデオ トラフィ … 続きを読む

カテゴリー: cs.AI, cs.MM, cs.NI, eess.IV | MADRL-Based Rate Adaptation for 360$\degree$ Video Streaming with Multi-Viewpoint Prediction はコメントを受け付けていません

Automatic Recognition of Food Ingestion Environment from the AIM-2 Wearable Sensor

要約 摂取環境の検出は、食事摂取量をモニタリングする際の重要な側面です。 食事の … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | Automatic Recognition of Food Ingestion Environment from the AIM-2 Wearable Sensor はコメントを受け付けていません

Improving Multimodal Learning with Multi-Loss Gradient Modulation

要約 オーディオやビデオなどの複数のモダリティから学習すると、補完的な情報を活用 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.MM, cs.SD, eess.AS | Improving Multimodal Learning with Multi-Loss Gradient Modulation はコメントを受け付けていません

Multimodal Multi-loss Fusion Network for Sentiment Analysis

要約 この論文では、複数のモダリティにわたる特徴エンコーダーの最適な選択と融合を … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.MM | Multimodal Multi-loss Fusion Network for Sentiment Analysis はコメントを受け付けていません