月別アーカイブ: 2024年2月

Instance by Instance: An Iterative Framework for Multi-instance 3D Registration

投稿日: 2024年2月7日作成者: jarxiv

要約マルチインスタンスの登録は、オブジェクトの複数のインスタンスを標準座標系に … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

CC-SGG: Corner Case Scenario Generation using Learned Scene Graphs

投稿日: 2024年2月7日作成者: jarxiv

要約コーナーケースのシナリオは、自動運転車 (AV) の安全性をテストおよび検 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO, I.2.10 | コメントを受け付けていません

Loci-Segmented: Improving Scene Segmentation Learning

投稿日: 2024年2月7日作成者: jarxiv

要約画像およびビデオから構成シーンをセグメンテーションするための現在のスロット … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

SMERF: Streamable Memory Efficient Radiance Fields for Real-Time Large-Scene Exploration

投稿日: 2024年2月7日作成者: jarxiv

要約リアルタイムビュー合成の最近の技術は、忠実度と速度が急速に進歩しており、 … 続きを読む →

カテゴリー: cs.CV, cs.GR | コメントを受け付けていません

We’re Not Using Videos Effectively: An Updated Domain Adaptive Video Segmentation Baseline

投稿日: 2024年2月7日作成者: jarxiv

要約セマンティックセグメンテーション (DAS) の教師なしドメイン適応では … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

CogCoM: Train Large Vision-Language Models Diving into Details through Chain of Manipulations

投稿日: 2024年2月7日作成者: jarxiv

要約視覚言語モデル (VLM) は、視覚的な指示と答えを一致させるための広範な … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

DirecT2V: Large Language Models are Frame-Level Directors for Zero-Shot Text-to-Video Generation

投稿日: 2024年2月7日作成者: jarxiv

要約 AI 生成コンテンツ (AIGC) のパラダイムでは、事前トレーニングされ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

HarmBench: A Standardized Evaluation Framework for Automated Red Teaming and Robust Refusal

投稿日: 2024年2月7日作成者: jarxiv

要約自動化されたレッドチーム化は、大規模言語モデル (LLM) の悪意のある … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

EVA-CLIP-18B: Scaling CLIP to 18 Billion Parameters

投稿日: 2024年2月7日作成者: jarxiv

要約対照的言語イメージ事前トレーニング (CLIP) をスケールアップすること … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Effective and Robust Non-Prehensile Manipulation via Persistent Homology Guided Monte-Carlo Tree Search

投稿日: 2024年2月7日作成者: jarxiv

要約現実世界のワークスペースでオブジェクトの取得を実行するには、\emph{不 … 続きを読む →

カテゴリー: cs.RO | コメントを受け付けていません

月別アーカイブ: 2024年2月

Instance by Instance: An Iterative Framework for Multi-instance 3D Registration

CC-SGG: Corner Case Scenario Generation using Learned Scene Graphs

Loci-Segmented: Improving Scene Segmentation Learning

SMERF: Streamable Memory Efficient Radiance Fields for Real-Time Large-Scene Exploration

We’re Not Using Videos Effectively: An Updated Domain Adaptive Video Segmentation Baseline

CogCoM: Train Large Vision-Language Models Diving into Details through Chain of Manipulations

DirecT2V: Large Language Models are Frame-Level Directors for Zero-Shot Text-to-Video Generation

HarmBench: A Standardized Evaluation Framework for Automated Red Teaming and Robust Refusal

EVA-CLIP-18B: Scaling CLIP to 18 Billion Parameters

Effective and Robust Non-Prehensile Manipulation via Persistent Homology Guided Monte-Carlo Tree Search

最近の投稿

最近のコメント

アーカイブ

カテゴリー