「cs.CV」カテゴリーアーカイブ

ES-Parkour: Advanced Robot Parkour with Bio-inspired Event Camera and Spiking Neural Network

投稿日: 2025年3月20日作成者: jarxiv

要約近年、四足動力装置は、特に強化学習を通じて知覚とモーション制御において大幅 … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.RO | コメントを受け付けていません

DRoPE: Directional Rotary Position Embedding for Efficient Agent Interaction Modeling

投稿日: 2025年3月20日作成者: jarxiv

要約エージェント相互作用の正確で効率的なモデリングは、自律運転システムの中核で … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

RoomTour3D: Geometry-Aware Video-Instruction Tuning for Embodied Navigation

投稿日: 2025年3月20日作成者: jarxiv

要約ビジョンと言語のナビゲーション（VLN）は、既存のシミュレーターの手動キュ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

Intelligent Spatial Perception by Building Hierarchical 3D Scene Graphs for Indoor Scenarios with the Help of LLMs

投稿日: 2025年3月20日作成者: jarxiv

要約このペーパーでは、大規模な言語モデル（LLMS）の機能を活用して屋内シナリ … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

TikZero: Zero-Shot Text-Guided Graphics Program Synthesis

投稿日: 2025年3月20日作成者: jarxiv

要約生成AIの増加に伴い、テキストキャプションからの合成図は説得力のあるアプリ … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Machine Unlearning in Hyperbolic vs. Euclidean Multimodal Contrastive Learning: Adapting Alignment Calibration to MERU

投稿日: 2025年3月20日作成者: jarxiv

要約大規模な事前訓練モデルでの選択的な概念除去にとって、マシンの未学習方法はま … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | コメントを受け付けていません

A Review on Large Language Models for Visual Analytics

投稿日: 2025年3月20日作成者: jarxiv

要約このペーパーでは、大規模な言語モデル（LLM）と視覚分析、基礎概念、能力、 … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.HC | コメントを受け付けていません

CoE: Chain-of-Explanation via Automatic Visual Concept Circuit Description and Polysemanticity Quantification

投稿日: 2025年3月20日作成者: jarxiv

要約説明可能性は、ディープビジョンモデル（DVM）の幅広い展開に影響を与える重 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Mitigating Ambiguities in 3D Classification with Gaussian Splatting

投稿日: 2025年3月20日作成者: jarxiv

要約ポイントクラウド入力による3D分類は、3Dビジョンの根本的な問題です。た … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

GaussRender: Learning 3D Occupancy with Gaussian Rendering

投稿日: 2025年3月20日作成者: jarxiv

要約運転シーンの3Dジオメトリとセマンティクスを理解することは、安全な自律運転 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

ES-Parkour: Advanced Robot Parkour with Bio-inspired Event Camera and Spiking Neural Network

DRoPE: Directional Rotary Position Embedding for Efficient Agent Interaction Modeling

RoomTour3D: Geometry-Aware Video-Instruction Tuning for Embodied Navigation

Intelligent Spatial Perception by Building Hierarchical 3D Scene Graphs for Indoor Scenarios with the Help of LLMs

TikZero: Zero-Shot Text-Guided Graphics Program Synthesis

Machine Unlearning in Hyperbolic vs. Euclidean Multimodal Contrastive Learning: Adapting Alignment Calibration to MERU

A Review on Large Language Models for Visual Analytics

CoE: Chain-of-Explanation via Automatic Visual Concept Circuit Description and Polysemanticity Quantification

Mitigating Ambiguities in 3D Classification with Gaussian Splatting

GaussRender: Learning 3D Occupancy with Gaussian Rendering

最近の投稿

最近のコメント

アーカイブ

カテゴリー