月別アーカイブ: 2024年1月

An attempt to generate new bridge types from latent space of variational autoencoder

要約 生成人工知能テクノロジーを使用して、新しい種類の橋を生成してみます。 コン … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | An attempt to generate new bridge types from latent space of variational autoencoder はコメントを受け付けていません

DiffusionLight: Light Probes for Free by Painting a Chrome Ball

要約 単一の入力画像内の照明を推定するための、シンプルかつ効果的な手法を紹介しま … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.LG, I.3.3 | DiffusionLight: Light Probes for Free by Painting a Chrome Ball はコメントを受け付けていません

Towards Full-scene Domain Generalization in Multi-agent Collaborative Bird’s Eye View Segmentation for Connected and Autonomous Driving

要約 協調知覚は、自動運転において最近大きな注目を集めており、車両間で追加情報を … 続きを読む

カテゴリー: cs.AI, cs.CV | Towards Full-scene Domain Generalization in Multi-agent Collaborative Bird’s Eye View Segmentation for Connected and Autonomous Driving はコメントを受け付けていません

MABViT — Modified Attention Block Enhances Vision Transformers

要約 最近の研究では、変換モデル、特に大規模言語モデル (LLM) の強化におけ … 続きを読む

カテゴリー: cs.CV, cs.LG | MABViT — Modified Attention Block Enhances Vision Transformers はコメントを受け付けていません

UDTIRI: An Online Open-Source Intelligent Road Inspection Benchmark Suite

要約 都市デジタルツイン (UDT) という初期の領域では、最先端のディープラー … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | UDTIRI: An Online Open-Source Intelligent Road Inspection Benchmark Suite はコメントを受け付けていません

ASSISTGUI: Task-Oriented Desktop Graphical User Interface Automation

要約 グラフィカル ユーザー インターフェイス (GUI) の自動化は、ユーザー … 続きを読む

カテゴリー: cs.CV | ASSISTGUI: Task-Oriented Desktop Graphical User Interface Automation はコメントを受け付けていません

NegVSR: Augmenting Negatives for Generalized Noise Modeling in Real-World Video Super-Resolution

要約 理想的なデータセットから高解像度 (HR) ビデオを合成するビデオ超解像度 … 続きを読む

カテゴリー: cs.CV | NegVSR: Augmenting Negatives for Generalized Noise Modeling in Real-World Video Super-Resolution はコメントを受け付けていません

FENet: Focusing Enhanced Network for Lane Detection

要約 人間の運転の焦点に触発されたこの研究は、フォーカシング サンプリング、部分 … 続きを読む

カテゴリー: cs.AI, cs.CV | FENet: Focusing Enhanced Network for Lane Detection はコメントを受け付けていません

Q-Bench: A Benchmark for General-Purpose Foundation Models on Low-level Vision

要約 マルチモダリティ大規模言語モデル (MLLM) の急速な進化により、コンピ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | Q-Bench: A Benchmark for General-Purpose Foundation Models on Low-level Vision はコメントを受け付けていません

ParisLuco3D: A high-quality target dataset for domain generalization of LiDAR perception

要約 LiDAR は、シーンに関する正確な幾何学的情報を収集することで、自動運転 … 続きを読む

カテゴリー: cs.CV, cs.RO | ParisLuco3D: A high-quality target dataset for domain generalization of LiDAR perception はコメントを受け付けていません