cs.CV」カテゴリーアーカイブ

ES-Parkour: Advanced Robot Parkour with Bio-inspired Event Camera and Spiking Neural Network

要約 近年、四足動力装置は、特に強化学習を通じて知覚とモーション制御において大幅 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | ES-Parkour: Advanced Robot Parkour with Bio-inspired Event Camera and Spiking Neural Network はコメントを受け付けていません

DRoPE: Directional Rotary Position Embedding for Efficient Agent Interaction Modeling

要約 エージェント相互作用の正確で効率的なモデリングは、自律運転システムの中核で … 続きを読む

カテゴリー: cs.CV, cs.RO | DRoPE: Directional Rotary Position Embedding for Efficient Agent Interaction Modeling はコメントを受け付けていません

RoomTour3D: Geometry-Aware Video-Instruction Tuning for Embodied Navigation

要約 ビジョンと言語のナビゲーション(VLN)は、既存のシミュレーターの手動キュ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | RoomTour3D: Geometry-Aware Video-Instruction Tuning for Embodied Navigation はコメントを受け付けていません

Intelligent Spatial Perception by Building Hierarchical 3D Scene Graphs for Indoor Scenarios with the Help of LLMs

要約 このペーパーでは、大規模な言語モデル(LLMS)の機能を活用して屋内シナリ … 続きを読む

カテゴリー: cs.CV, cs.RO | Intelligent Spatial Perception by Building Hierarchical 3D Scene Graphs for Indoor Scenarios with the Help of LLMs はコメントを受け付けていません

TikZero: Zero-Shot Text-Guided Graphics Program Synthesis

要約 生成AIの増加に伴い、テキストキャプションからの合成図は説得力のあるアプリ … 続きを読む

カテゴリー: cs.CL, cs.CV | TikZero: Zero-Shot Text-Guided Graphics Program Synthesis はコメントを受け付けていません

Machine Unlearning in Hyperbolic vs. Euclidean Multimodal Contrastive Learning: Adapting Alignment Calibration to MERU

要約 大規模な事前訓練モデルでの選択的な概念除去にとって、マシンの未学習方法はま … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | Machine Unlearning in Hyperbolic vs. Euclidean Multimodal Contrastive Learning: Adapting Alignment Calibration to MERU はコメントを受け付けていません

A Review on Large Language Models for Visual Analytics

要約 このペーパーでは、大規模な言語モデル(LLM)と視覚分析、基礎概念、能力、 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.HC | A Review on Large Language Models for Visual Analytics はコメントを受け付けていません

CoE: Chain-of-Explanation via Automatic Visual Concept Circuit Description and Polysemanticity Quantification

要約 説明可能性は、ディープビジョンモデル(DVM)の幅広い展開に影響を与える重 … 続きを読む

カテゴリー: cs.AI, cs.CV | CoE: Chain-of-Explanation via Automatic Visual Concept Circuit Description and Polysemanticity Quantification はコメントを受け付けていません

Mitigating Ambiguities in 3D Classification with Gaussian Splatting

要約 ポイントクラウド入力による3D分類は、3Dビジョンの根本的な問題です。 た … 続きを読む

カテゴリー: cs.CV | Mitigating Ambiguities in 3D Classification with Gaussian Splatting はコメントを受け付けていません

GaussRender: Learning 3D Occupancy with Gaussian Rendering

要約 運転シーンの3Dジオメトリとセマンティクスを理解することは、安全な自律運転 … 続きを読む

カテゴリー: cs.CV | GaussRender: Learning 3D Occupancy with Gaussian Rendering はコメントを受け付けていません