-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年6月
On Evaluating Adversarial Robustness of Volumetric Medical Segmentation Models
要約 体積医療セグメンテーション モデルは、近年、臓器および腫瘍ベースのセグメン … 続きを読む
Beyond LLaVA-HD: Diving into High-Resolution Large Multimodal Models
要約 高解像度ではっきりと見ることは、視覚認識と推論に不可欠であることが証明され … 続きを読む
カテゴリー: cs.CV
Beyond LLaVA-HD: Diving into High-Resolution Large Multimodal Models はコメントを受け付けていません
ICE-G: Image Conditional Editing of 3D Gaussian Splats
要約 最近、高品質の 3D アセットやシーンを作成するための多くの技術が登場しま … 続きを読む
CounterCurate: Enhancing Physical and Semantic Visio-Linguistic Compositional Reasoning via Counterfactual Examples
要約 私たちは、対比モデルと生成マルチモーダル モデルの両方の視覚言語的構成推論 … 続きを読む
3D-GRAND: A Million-Scale Dataset for 3D-LLMs with Better Grounding and Less Hallucination
要約 言語と 3D 認識の統合は、物理世界を理解し、相互作用する身体化されたエー … 続きを読む
SPIN: Spacecraft Imagery for Navigation
要約 宇宙運用のコストと複雑さのため、宇宙運用条件で取得されるデータは不足してい … 続きを読む
カテゴリー: cs.CV
SPIN: Spacecraft Imagery for Navigation はコメントを受け付けていません
An Empirical Design Justice Approach to Identifying Ethical Considerations in the Intersection of Large Language Models and Social Robotics
要約 大規模言語モデル (LLM) をソーシャル ロボット工学に統合すると、独特 … 続きを読む
AI Sandbagging: Language Models can Strategically Underperform on Evaluations
要約 信頼できる機能評価は AI システムの安全性を確保するために不可欠であり、 … 続きを読む
CADS: A Systematic Literature Review on the Challenges of Abstractive Dialogue Summarization
要約 抽象的な対話の要約は、会話を有益で簡潔な要約に抽出するタスクです。 このテ … 続きを読む
OphNet: A Large-Scale Video Benchmark for Ophthalmic Surgical Workflow Understanding
要約 ビデオによる手術シーンの認識は、特に眼科におけるロボット手術、遠隔手術、A … 続きを読む
カテゴリー: cs.CV
OphNet: A Large-Scale Video Benchmark for Ophthalmic Surgical Workflow Understanding はコメントを受け付けていません