月別アーカイブ: 2024年1月

An attempt to generate new bridge types from latent space of variational autoencoder

投稿日: 2024年1月2日作成者: jarxiv

要約生成人工知能テクノロジーを使用して、新しい種類の橋を生成してみます。コン … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

DiffusionLight: Light Probes for Free by Painting a Chrome Ball

投稿日: 2024年1月2日作成者: jarxiv

要約単一の入力画像内の照明を推定するための、シンプルかつ効果的な手法を紹介しま … 続きを読む →

カテゴリー: cs.CV, cs.GR, cs.LG, I.3.3 | コメントを受け付けていません

Towards Full-scene Domain Generalization in Multi-agent Collaborative Bird’s Eye View Segmentation for Connected and Autonomous Driving

投稿日: 2024年1月2日作成者: jarxiv

要約協調知覚は、自動運転において最近大きな注目を集めており、車両間で追加情報を … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

MABViT — Modified Attention Block Enhances Vision Transformers

投稿日: 2024年1月2日作成者: jarxiv

要約最近の研究では、変換モデル、特に大規模言語モデル (LLM) の強化におけ … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

UDTIRI: An Online Open-Source Intelligent Road Inspection Benchmark Suite

投稿日: 2024年1月2日作成者: jarxiv

要約都市デジタルツイン (UDT) という初期の領域では、最先端のディープラー … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

ASSISTGUI: Task-Oriented Desktop Graphical User Interface Automation

投稿日: 2024年1月2日作成者: jarxiv

要約グラフィカルユーザーインターフェイス (GUI) の自動化は、ユーザー … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

NegVSR: Augmenting Negatives for Generalized Noise Modeling in Real-World Video Super-Resolution

投稿日: 2024年1月2日作成者: jarxiv

要約理想的なデータセットから高解像度 (HR) ビデオを合成するビデオ超解像度 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

FENet: Focusing Enhanced Network for Lane Detection

投稿日: 2024年1月2日作成者: jarxiv

要約人間の運転の焦点に触発されたこの研究は、フォーカシングサンプリング、部分 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Q-Bench: A Benchmark for General-Purpose Foundation Models on Low-level Vision

投稿日: 2024年1月2日作成者: jarxiv

要約マルチモダリティ大規模言語モデル (MLLM) の急速な進化により、コンピ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM | コメントを受け付けていません

ParisLuco3D: A high-quality target dataset for domain generalization of LiDAR perception

投稿日: 2024年1月2日作成者: jarxiv

要約 LiDAR は、シーンに関する正確な幾何学的情報を収集することで、自動運転 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

月別アーカイブ: 2024年1月

An attempt to generate new bridge types from latent space of variational autoencoder

DiffusionLight: Light Probes for Free by Painting a Chrome Ball

Towards Full-scene Domain Generalization in Multi-agent Collaborative Bird’s Eye View Segmentation for Connected and Autonomous Driving

MABViT — Modified Attention Block Enhances Vision Transformers

UDTIRI: An Online Open-Source Intelligent Road Inspection Benchmark Suite

ASSISTGUI: Task-Oriented Desktop Graphical User Interface Automation

NegVSR: Augmenting Negatives for Generalized Noise Modeling in Real-World Video Super-Resolution

FENet: Focusing Enhanced Network for Lane Detection

Q-Bench: A Benchmark for General-Purpose Foundation Models on Low-level Vision

ParisLuco3D: A high-quality target dataset for domain generalization of LiDAR perception

最近の投稿

最近のコメント

アーカイブ

カテゴリー