月別アーカイブ: 2023年6月

Image Captioners Are Scalable Vision Learners Too

要約 Web からの画像とテキストのペアに対する対照的な事前トレーニングは、特に … 続きを読む

カテゴリー: cs.CV | Image Captioners Are Scalable Vision Learners Too はコメントを受け付けていません

Continuous Cost Aggregation for Dual-Pixel Disparity Extraction

要約 最近の研究では、デュアルピクセル (DP) センサーから深度情報を取得でき … 続きを読む

カテゴリー: cs.CV | Continuous Cost Aggregation for Dual-Pixel Disparity Extraction はコメントを受け付けていません

MOFI: Learning Image Representations from Noisy Entity Annotated Images

要約 我々は、ノイズのあるエンティティの注釈付き画像から画像表現を学習するように … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | MOFI: Learning Image Representations from Noisy Entity Annotated Images はコメントを受け付けていません

Rerender A Video: Zero-Shot Text-Guided Video-to-Video Translation

要約 大規模なテキストから画像への拡散モデルは、高品質の画像を生成する際に優れた … 続きを読む

カテゴリー: cs.CV | Rerender A Video: Zero-Shot Text-Guided Video-to-Video Translation はコメントを受け付けていません

Hidden Biases of End-to-End Driving Models

要約 エンドツーエンドの駆動システムは、特に CARLA において、最近急速に進 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Hidden Biases of End-to-End Driving Models はコメントを受け付けていません

Parting with Misconceptions about Learning-based Vehicle Motion Planning

要約 nuPlan のリリースは、正確な短期計画と長期的な自己予測の両方を必要と … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Parting with Misconceptions about Learning-based Vehicle Motion Planning はコメントを受け付けていません

One-for-All: Generalized LoRA for Parameter-Efficient Fine-tuning

要約 汎用的なパラメーター効率の高い微調整タスクのための高度なアプローチである … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | One-for-All: Generalized LoRA for Parameter-Efficient Fine-tuning はコメントを受け付けていません

Neural Scene Chronology

要約 この研究では、大規模ランドマークのインターネット写真から、視点、照明、時間 … 続きを読む

カテゴリー: cs.CV | Neural Scene Chronology はコメントを受け付けていません

GeneCIS: A Benchmark for General Conditional Image Similarity

要約 私たちは、「類似性」には多くの概念があり、人間と同様にモデルもこれらの概念 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | GeneCIS: A Benchmark for General Conditional Image Similarity はコメントを受け付けていません

XrayGPT: Chest Radiographs Summarization using Medical Vision-Language Models

要約 Bard や GPT-4 などの大規模ビジョン言語モデルにおける最新のブレ … 続きを読む

カテゴリー: cs.CV | XrayGPT: Chest Radiographs Summarization using Medical Vision-Language Models はコメントを受け付けていません