月別アーカイブ: 2024年2月

Instance by Instance: An Iterative Framework for Multi-instance 3D Registration

要約 マルチインスタンスの登録は、オブジェクトの複数のインスタンスを標準座標系に … 続きを読む

カテゴリー: cs.CV | Instance by Instance: An Iterative Framework for Multi-instance 3D Registration はコメントを受け付けていません

CC-SGG: Corner Case Scenario Generation using Learned Scene Graphs

要約 コーナーケースのシナリオは、自動運転車 (AV) の安全性をテストおよび検 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO, I.2.10 | CC-SGG: Corner Case Scenario Generation using Learned Scene Graphs はコメントを受け付けていません

Loci-Segmented: Improving Scene Segmentation Learning

要約 画像およびビデオから構成シーンをセグメンテーションするための現在のスロット … 続きを読む

カテゴリー: cs.CV | Loci-Segmented: Improving Scene Segmentation Learning はコメントを受け付けていません

SMERF: Streamable Memory Efficient Radiance Fields for Real-Time Large-Scene Exploration

要約 リアルタイム ビュー合成の最近の技術は、忠実度と速度が急速に進歩しており、 … 続きを読む

カテゴリー: cs.CV, cs.GR | SMERF: Streamable Memory Efficient Radiance Fields for Real-Time Large-Scene Exploration はコメントを受け付けていません

We’re Not Using Videos Effectively: An Updated Domain Adaptive Video Segmentation Baseline

要約 セマンティック セグメンテーション (DAS) の教師なしドメイン適応では … 続きを読む

カテゴリー: cs.CV | We’re Not Using Videos Effectively: An Updated Domain Adaptive Video Segmentation Baseline はコメントを受け付けていません

CogCoM: Train Large Vision-Language Models Diving into Details through Chain of Manipulations

要約 視覚言語モデル (VLM) は、視覚的な指示と答えを一致させるための広範な … 続きを読む

カテゴリー: cs.CL, cs.CV | CogCoM: Train Large Vision-Language Models Diving into Details through Chain of Manipulations はコメントを受け付けていません

DirecT2V: Large Language Models are Frame-Level Directors for Zero-Shot Text-to-Video Generation

要約 AI 生成コンテンツ (AIGC) のパラダイムでは、事前トレーニングされ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | DirecT2V: Large Language Models are Frame-Level Directors for Zero-Shot Text-to-Video Generation はコメントを受け付けていません

HarmBench: A Standardized Evaluation Framework for Automated Red Teaming and Robust Refusal

要約 自動化されたレッド チーム化は、大規模言語モデル (LLM) の悪意のある … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | HarmBench: A Standardized Evaluation Framework for Automated Red Teaming and Robust Refusal はコメントを受け付けていません

EVA-CLIP-18B: Scaling CLIP to 18 Billion Parameters

要約 対照的言語イメージ事前トレーニング (CLIP) をスケールアップすること … 続きを読む

カテゴリー: cs.CV | EVA-CLIP-18B: Scaling CLIP to 18 Billion Parameters はコメントを受け付けていません

Effective and Robust Non-Prehensile Manipulation via Persistent Homology Guided Monte-Carlo Tree Search

要約 現実世界のワークスペースでオブジェクトの取得を実行するには、\emph{不 … 続きを読む

カテゴリー: cs.RO | Effective and Robust Non-Prehensile Manipulation via Persistent Homology Guided Monte-Carlo Tree Search はコメントを受け付けていません