-
最近の投稿
- Establishing Linear Surrogate Regret Bounds for Convex Smooth Losses via Convolutional Fenchel-Young Losses
- Towards Fair In-Context Learning with Tabular Foundation Models
- FAMMA: A Benchmark for Financial Domain Multilingual Multimodal Question Answering
- Construction and Application of Materials Knowledge Graph in Multidisciplinary Materials Science via Large Language Model
- RT-cache: Efficient Robot Trajectory Retrieval System
-
最近のコメント
表示できるコメントはありません。 cs.AI (38112) cs.CL (28799) cs.CV (43686) cs.HC (2911) cs.LG (43034) cs.RO (22672) cs.SY (3480) eess.IV (5065) eess.SY (3472) stat.ML (5605)
「cs.MM」カテゴリーアーカイブ
LLMER: Crafting Interactive Extended Reality Worlds with JSON Data Generated by Large Language Models
要約 GPT-4のような大規模言語モデル(LLM)と拡張現実感(XR)技術の統合 … 続きを読む
DreamArtist++: Controllable One-Shot Text-to-Image Generation via Positive-Negative Adapter
要約 Imagenや安定した拡散モデルなどの最先端のテキストからイメージからイメ … 続きを読む
Inkspire: Supporting Design Exploration with Generative AI through Analogical Sketching
要約 テキストツーイメージ(T2I)AIモデルの能力に最近の進歩により、製品設計 … 続きを読む
When Video Coding Meets Multimodal Large Language Models: A Unified Paradigm for Video Coding
要約 既存のコーデックは、固有の冗長性を排除して、圧縮のためのコンパクトな表現を … 続きを読む
MIDI-GPT: A Controllable Generative Model for Computer-Assisted Multitrack Music Composition
要約 コンピューター支援の音楽構成ワークフロー向けに設計された変圧器アーキテクチ … 続きを読む
Audio-Visual Deepfake Detection With Local Temporal Inconsistencies
要約 このペーパーでは、オーディオと視覚モダリティの間のきめの細かい時間的矛盾を … 続きを読む
MetaDecorator: Generating Immersive Virtual Tours through Multimodality
要約 Metadecoratorは、ユーザーが仮想スペースをパーソナライズできる … 続きを読む
Mitigating GenAI-powered Evidence Pollution for Out-of-Context Multimodal Misinformation Detection
要約 大規模な生成的人工知能(Genai)モデルは大幅に成功しましたが、欺cep … 続きを読む
Tune In, Act Up: Exploring the Impact of Audio Modality-Specific Edits on Large Audio Language Models in Jailbreak
要約 大規模言語モデル (LLM) は、さまざまな自然言語処理タスクにわたって優 … 続きを読む
Long-Form Text-to-Music Generation with Adaptive Prompts: A Case of Study in Tabletop Role-Playing Games Soundtracks
要約 この論文では、テーブルトップ ロール プレイング ゲーム (TRPG) の … 続きを読む