-
最近の投稿
- Counter-Hypothetical Particle Filters for Single Object Pose Tracking
- Robust High-Speed State Estimation for Off-road Navigation using Radar Velocity Factors
- A Propagation Perspective on Recursive Forward Dynamics for Systems with Kinematic Loops
- D2S: Representing sparse descriptors and 3D coordinates for camera relocalization
- Geometric Graph Neural Network Modeling of Human Interactions in Crowded Environments
-
最近のコメント
表示できるコメントはありません。 cs.AI (28533) cs.CL (21568) cs.CR (2228) cs.CV (35151) cs.LG (33295) cs.RO (16470) cs.SY (2535) eess.IV (4282) eess.SY (2529) stat.ML (4465)
月別アーカイブ: 2024年6月
On Evaluating Adversarial Robustness of Volumetric Medical Segmentation Models
要約 体積医療セグメンテーション モデルは、近年、臓器および腫瘍ベースのセグメン … 続きを読む
Beyond LLaVA-HD: Diving into High-Resolution Large Multimodal Models
要約 高解像度ではっきりと見ることは、視覚認識と推論に不可欠であることが証明され … 続きを読む
カテゴリー: cs.CV
Beyond LLaVA-HD: Diving into High-Resolution Large Multimodal Models はコメントを受け付けていません
ICE-G: Image Conditional Editing of 3D Gaussian Splats
要約 最近、高品質の 3D アセットやシーンを作成するための多くの技術が登場しま … 続きを読む
CounterCurate: Enhancing Physical and Semantic Visio-Linguistic Compositional Reasoning via Counterfactual Examples
要約 私たちは、対比モデルと生成マルチモーダル モデルの両方の視覚言語的構成推論 … 続きを読む
3D-GRAND: A Million-Scale Dataset for 3D-LLMs with Better Grounding and Less Hallucination
要約 言語と 3D 認識の統合は、物理世界を理解し、相互作用する身体化されたエー … 続きを読む
SPIN: Spacecraft Imagery for Navigation
要約 宇宙運用のコストと複雑さのため、宇宙運用条件で取得されるデータは不足してい … 続きを読む
カテゴリー: cs.CV
SPIN: Spacecraft Imagery for Navigation はコメントを受け付けていません
An Empirical Design Justice Approach to Identifying Ethical Considerations in the Intersection of Large Language Models and Social Robotics
要約 大規模言語モデル (LLM) をソーシャル ロボット工学に統合すると、独特 … 続きを読む
AI Sandbagging: Language Models can Strategically Underperform on Evaluations
要約 信頼できる機能評価は AI システムの安全性を確保するために不可欠であり、 … 続きを読む
CADS: A Systematic Literature Review on the Challenges of Abstractive Dialogue Summarization
要約 抽象的な対話の要約は、会話を有益で簡潔な要約に抽出するタスクです。 このテ … 続きを読む
OphNet: A Large-Scale Video Benchmark for Ophthalmic Surgical Workflow Understanding
要約 ビデオによる手術シーンの認識は、特に眼科におけるロボット手術、遠隔手術、A … 続きを読む
カテゴリー: cs.CV
OphNet: A Large-Scale Video Benchmark for Ophthalmic Surgical Workflow Understanding はコメントを受け付けていません