-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
Semi-Automated Quality Assurance in Digital Pathology: Tile Classification Approach
要約 品質保証は、マイナーなアーティファクトでさえ大きな効果をもたらす可能性のあ … 続きを読む
Visually Descriptive Language Model for Vector Graphics Reasoning
要約 大きな進歩にもかかわらず、大規模なマルチモーダルモデル(LMM)は、形状、 … 続きを読む
VINCIE: Unlocking In-context Image Editing from Video
要約 コンテキスト内画像編集は、テキストと以前に生成された画像を含むコンテキスト … 続きを読む
CAT: A Conditional Adaptation Tailor for Efficient and Effective Instance-Specific Pansharpening on Real-World Data
要約 Pansharpeningは、高解像度のパンクロマティック(PAN)画像と … 続きを読む
カテゴリー: cs.CV
CAT: A Conditional Adaptation Tailor for Efficient and Effective Instance-Specific Pansharpening on Real-World Data はコメントを受け付けていません
ReGuidance: A Simple Diffusion Wrapper for Boosting Sample Quality on Hard Inverse Problems
要約 逆の問題を解決するための情報に基づいたデータ事前に、より一般的には報酬モデ … 続きを読む
SpectralAR: Spectral Autoregressive Visual Generation
要約 自己回帰視覚生成は、拡散モデルと比較して、そのスケーラビリティと他のモダリ … 続きを読む
MMMG: A Massive, Multidisciplinary, Multi-Tier Generation Benchmark for Text-to-Image Reasoning
要約 このホワイトペーパーでは、画像生成モデルの推論能力を調査するために、大規模 … 続きを読む
Beyond Attention or Similarity: Maximizing Conditional Diversity for Token Pruning in MLLMs
要約 マルチモーダルの大手言語モデル(MLLMS)では、入力視覚トークンの長さは … 続きを読む
Eye, Robot: Learning to Look to Act with a BC-RL Perception-Action Loop
要約 人間は視覚的な世界を受動的に観察しません – 私たちは行動する … 続きを読む
GenWorld: Towards Detecting AI-generated Real-world Simulation Videos
要約 ビデオ生成テクノロジーの繁栄は、実際の情報の信頼性を危険にさらし、AIに生 … 続きを読む
カテゴリー: cs.CV
GenWorld: Towards Detecting AI-generated Real-world Simulation Videos はコメントを受け付けていません