-
最近の投稿
- Nearest-Neighbourless Asymptotically Optimal Motion Planning with Fully Connected Informed Trees (FCIT*)
- Performance assessment of ADAS in a representative subset of critical traffic situations
- Exciting Contact Modes in Differentiable Simulations for Robot Learning
- Can LLMs plan paths in the real world?
- DECODE: Domain-aware Continual Domain Expansion for Motion Prediction
-
最近のコメント
表示できるコメントはありません。 cs.AI (30257) cs.CL (22857) cs.CR (2346) cs.CV (36632) cs.LG (35077) cs.RO (17603) cs.SY (2704) eess.IV (4458) eess.SY (2698) stat.ML (4675)
「cs.MM」カテゴリーアーカイブ
Rethinking Multi-view Representation Learning via Distilled Disentangling
要約 マルチビュー表現学習の目的は、多様なデータ ソースからビューの一貫性とビュ … 続きを読む
Language Model Beats Diffusion — Tokenizer is Key to Visual Generation
要約 大規模言語モデル (LLM) は、言語の生成タスクでは主要なモデルですが、 … 続きを読む
Evaluating gesture generation in a large-scale open challenge: The GENEA Challenge 2022
要約 この論文では、データ駆動型自動同時音声ジェスチャ生成のベンチマークを目的と … 続きを読む
MagicLens: Self-Supervised Image Retrieval with Open-Ended Instructions
要約 画像検索、つまり参照画像から目的の画像を見つけることには、本質的に豊富で多 … 続きを読む
Bringing Textual Prompt to AI-Generated Image Quality Assessment
要約 AI 生成画像 (AGI) には、本質的にマルチモーダルな性質があります。 … 続きを読む
Mitigating Hallucinations in Large Vision-Language Models with Instruction Contrastive Decoding
要約 大規模視覚言語モデル (LVLM) は、視覚入力から状況に応じて詳細で一貫 … 続きを読む
Real Acoustic Fields: An Audio-Visual Room Acoustics Dataset and Benchmark
要約 複数のモダリティから実際の音響室データをキャプチャする Real Acou … 続きを読む
FastPerson: Enhancing Video Learning through Effective Video Summarization that Preserves Linguistic and Visual Contexts
要約 時間が限られており、さまざまなトピックに興味がある学習者にとって、学習効率 … 続きを読む
GTA-HDR: A Large-Scale Synthetic Dataset for HDR Image Reconstruction
要約 ハイ ダイナミック レンジ (HDR) コンテンツ (つまり、画像やビデオ … 続きを読む
カテゴリー: Computer vision, cs.CV, cs.GR, cs.LG, cs.MM, Deep learning, eess.IV, I.3.3
GTA-HDR: A Large-Scale Synthetic Dataset for HDR Image Reconstruction はコメントを受け付けていません
Boosting Diffusion Models with Moving Average Sampling in Frequency Domain
要約 拡散モデルは最近、画像生成に強力な革命をもたらしました。 これらのモデルの … 続きを読む