cs.CV」カテゴリーアーカイブ

Keypoint Abstraction using Large Models for Object-Relative Imitation Learning

要約 多様なタスクや環境にわたる新しいオブジェクト構成やインスタンスへの一般化は … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Keypoint Abstraction using Large Models for Object-Relative Imitation Learning はコメントを受け付けていません

DisC-GS: Discontinuity-aware Gaussian Splatting

要約 最近、ガウス分布の集合として 3D シーンを表現する手法であるガウス スプ … 続きを読む

カテゴリー: cs.CV | DisC-GS: Discontinuity-aware Gaussian Splatting はコメントを受け付けていません

EMMA: End-to-End Multimodal Model for Autonomous Driving

要約 自動運転のためのエンドツーエンドのマルチモーダルモデルであるEMMAを紹介 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | EMMA: End-to-End Multimodal Model for Autonomous Driving はコメントを受け付けていません

Certified Robustness to Data Poisoning in Gradient-Based Training

要約 最新の機械学習パイプラインは大量の公開データを活用しているため、データの品 … 続きを読む

カテゴリー: cs.CR, cs.CV, cs.LG | Certified Robustness to Data Poisoning in Gradient-Based Training はコメントを受け付けていません

TOMATO: Assessing Visual Temporal Reasoning Capabilities in Multimodal Foundation Models

要約 既存のベンチマークでは、ビデオ理解のための時間的コンテキストを活用する際に … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | TOMATO: Assessing Visual Temporal Reasoning Capabilities in Multimodal Foundation Models はコメントを受け付けていません

Multi-student Diffusion Distillation for Better One-step Generators

要約 拡散モデルは、長時間にわたる複数ステップの推論手順を犠牲にして、高品質のサ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Multi-student Diffusion Distillation for Better One-step Generators はコメントを受け付けていません

SlowFast-VGen: Slow-Fast Learning for Action-Driven Long Video Generation

要約 人間には、一般的な世界の動きの遅い学習と、新しい経験からのエピソード記憶の … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | SlowFast-VGen: Slow-Fast Learning for Action-Driven Long Video Generation はコメントを受け付けていません

OpenSatMap: A Fine-grained High-resolution Satellite Dataset for Large-scale Map Construction

要約 この論文では、大規模な地図構築のためのきめの細かい高解像度の衛星データセッ … 続きを読む

カテゴリー: cs.CV | OpenSatMap: A Fine-grained High-resolution Satellite Dataset for Large-scale Map Construction はコメントを受け付けていません

RelationBooth: Towards Relation-Aware Customized Object Generation

要約 カスタマイズされた画像の生成は、ユーザーが提供する画像プロンプトに基づいて … 続きを読む

カテゴリー: cs.CV | RelationBooth: Towards Relation-Aware Customized Object Generation はコメントを受け付けていません

ReferEverything: Towards Segmenting Everything We Can Speak of in Videos

要約 自然言語を通じて説明できるビデオ内の幅広い概念をセグメント化するためのフレ … 続きを読む

カテゴリー: cs.CV | ReferEverything: Towards Segmenting Everything We Can Speak of in Videos はコメントを受け付けていません