投稿者「jarxiv」のアーカイブ

Improving Video Generation with Human Feedback

要約 ビデオ生成は、修正されたフロー技術によって大幅な進歩を遂げましたが、スムー … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG | Improving Video Generation with Human Feedback はコメントを受け付けていません

Truncated Consistency Models

要約 一貫性モデルが最近導入され、初期ノイズからの確率フローオード(PF ODE … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Truncated Consistency Models はコメントを受け付けていません

Temporal Preference Optimization for Long-Form Video Understanding

要約 ビデオの大規模なマルチモーダルモデル(ビデオLMMS)の大幅な進歩にもかか … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | Temporal Preference Optimization for Long-Form Video Understanding はコメントを受け付けていません

IMAGINE-E: Image Generation Intelligence Evaluation of State-of-the-art Text-to-Image Models

要約 拡散モデルの急速な発展により、テキストからイメージ(T2I)モデルは大きな … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | IMAGINE-E: Image Generation Intelligence Evaluation of State-of-the-art Text-to-Image Models はコメントを受け付けていません

GeoPixel: Pixel Grounding Large Multimodal Model in Remote Sensing

要約 大規模なマルチモーダルモデル(LMMS)の最近の進歩は、視覚的理解と対話の … 続きを読む

カテゴリー: cs.CV | GeoPixel: Pixel Grounding Large Multimodal Model in Remote Sensing はコメントを受け付けていません

Towards Robust Multimodal Open-set Test-time Adaptation via Adaptive Entropy-aware Optimization

要約 テスト時間適応(TTA)は、トレーニングとテストデータの間の分布シフトに対 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Towards Robust Multimodal Open-set Test-time Adaptation via Adaptive Entropy-aware Optimization はコメントを受け付けていません

Can We Generate Images with CoT? Let’s Verify and Reinforce Image Generation Step by Step

要約 思考連鎖 (CoT) 推論は、複雑な理解タスクに取り組むために、大規模なモ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Can We Generate Images with CoT? Let’s Verify and Reinforce Image Generation Step by Step はコメントを受け付けていません

CRPO: Confidence-Reward Driven Preference Optimization for Machine Translation

要約 大規模言語モデル (LLM) は、自然言語処理タスクにおいて大きな可能性を … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | CRPO: Confidence-Reward Driven Preference Optimization for Machine Translation はコメントを受け付けていません

Fast3R: Towards 3D Reconstruction of 1000+ Images in One Forward Pass

要約 マルチビュー3D再構成は、特に多様な視点で正確でスケーラブルな表現を必要と … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.RO | Fast3R: Towards 3D Reconstruction of 1000+ Images in One Forward Pass はコメントを受け付けていません

Guaranteed Recovery of Unambiguous Clusters

要約 クラスタリングは、「正しい」クラスタリングがどうあるべきかという本質的なあ … 続きを読む

カテゴリー: cs.AI, cs.DS, cs.IT, cs.LG, math.IT, math.ST, stat.TH | Guaranteed Recovery of Unambiguous Clusters はコメントを受け付けていません