cs.CV」カテゴリーアーカイブ

Robust image classification with multi-modal large language models

要約 ディープ ニューラル ネットワークは、敵対的な例、つまり、モデルが高い信頼 … 続きを読む

カテゴリー: cs.CR, cs.CV, cs.LG | Robust image classification with multi-modal large language models はコメントを受け付けていません

Apollo: An Exploration of Video Understanding in Large Multimodal Models

要約 ビデオ認識機能は大規模マルチモーダル モデル (LMM) に急速に統合され … 続きを読む

カテゴリー: cs.AI, cs.CV | Apollo: An Exploration of Video Understanding in Large Multimodal Models はコメントを受け付けていません

OP-LoRA: The Blessing of Dimensionality

要約 低ランクのアダプターを使用すると、少数のパラメーターのみで大規模なモデルを … 続きを読む

カテゴリー: cs.CV, cs.LG | OP-LoRA: The Blessing of Dimensionality はコメントを受け付けていません

A Grounded Typology of Word Classes

要約 私たちは言語類型論における意味に対する根拠に基づいたアプローチを提案します … 続きを読む

カテゴリー: cs.CL, cs.CV | A Grounded Typology of Word Classes はコメントを受け付けていません

GaussianAD: Gaussian-Centric End-to-End Autonomous Driving

要約 ビジョンベースの自動運転は、その満足のいく性能と低コストにより、大きな可能 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | GaussianAD: Gaussian-Centric End-to-End Autonomous Driving はコメントを受け付けていません

UniMed-CLIP: Towards a Unified Image-Text Pretraining Paradigm for Diverse Medical Imaging Modalities

要約 対照学習によってトレーニングされた視覚言語モデル (VLM) は、自然画像 … 続きを読む

カテゴリー: cs.CV | UniMed-CLIP: Towards a Unified Image-Text Pretraining Paradigm for Diverse Medical Imaging Modalities はコメントを受け付けていません

GaussianWorld: Gaussian World Model for Streaming 3D Occupancy Prediction

要約 3D 乗員予測は、周囲の状況を包括的に認識できるため、自動運転にとって重要 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | GaussianWorld: Gaussian World Model for Streaming 3D Occupancy Prediction はコメントを受け付けていません

Olympus: A Universal Task Router for Computer Vision Tasks

要約 マルチモーダル大規模言語モデル (MLLM) を、さまざまなコンピューター … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Olympus: A Universal Task Router for Computer Vision Tasks はコメントを受け付けていません

DriveMM: All-in-One Large Multimodal Model for Autonomous Driving

要約 大規模マルチモーダル モデル (LMM) は、大規模な言語モデルを組み込む … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.RO | DriveMM: All-in-One Large Multimodal Model for Autonomous Driving はコメントを受け付けていません

Hidden Biases of End-to-End Driving Datasets

要約 エンドツーエンドの駆動システムは急速に進歩していますが、これまでのところ、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Hidden Biases of End-to-End Driving Datasets はコメントを受け付けていません