-
最近の投稿
- Bayesian optimization for robust robotic grasping using a sensorized compliant hand
- Lessons from Learning to Spin ‘Pens’
- Uncertainty-Aware Planning for Heterogeneous Robot Teams using Dynamic Topological Graphs and Mixed-Integer Programming
- Screw Geometry Meets Bandits: Incremental Acquisition of Demonstrations to Generate Manipulation Plans
- Search-Based Path Planning among Movable Obstacles
-
最近のコメント
表示できるコメントはありません。 cs.AI (28604) cs.CL (21619) cs.CR (2231) cs.CV (35206) cs.LG (33368) cs.RO (16520) cs.SY (2542) eess.IV (4287) eess.SY (2536) stat.ML (4474)
月別アーカイブ: 2024年5月
Siamese Learning with Joint Alignment and Regression for Weakly-Supervised Video Paragraph Grounding
要約 ビデオ パラグラフ グラウンディング (VPG) は、ビデオ言語理解におけ … 続きを読む
カテゴリー: cs.CV
Siamese Learning with Joint Alignment and Regression for Weakly-Supervised Video Paragraph Grounding はコメントを受け付けていません
Incorporating Clinical Guidelines through Adapting Multi-modal Large Language Model for Prostate Cancer PI-RADS Scoring
要約 前立腺画像レポートおよびデータ システム (PI-RADS) は、MRI … 続きを読む
カテゴリー: cs.CV
Incorporating Clinical Guidelines through Adapting Multi-modal Large Language Model for Prostate Cancer PI-RADS Scoring はコメントを受け付けていません
Ambiguous Annotations: When is a Pedestrian not a Pedestrian?
要約 ヒューマン アノテーターによってラベル付けされたデータセットは、機械学習モ … 続きを読む
カテゴリー: cs.CV
Ambiguous Annotations: When is a Pedestrian not a Pedestrian? はコメントを受け付けていません
SciFIBench: Benchmarking Large Multimodal Models for Scientific Figure Interpretation
要約 大規模マルチモーダル モデル (LMM) は、多くのタスクや分野にわたって … 続きを読む
カテゴリー: cs.CV
SciFIBench: Benchmarking Large Multimodal Models for Scientific Figure Interpretation はコメントを受け付けていません
A Single Graph Convolution Is All You Need: Efficient Grayscale Image Classification
要約 画像分類器はタスクを畳み込みニューラル ネットワーク (CNN) に依存す … 続きを読む
RealFill: Reference-Driven Generation for Authentic Image Completion
要約 生成画像の最近の進歩により、未知の領域に高品質で妥当な画像コンテンツを生成 … 続きを読む
CinePile: A Long Video Question Answering Dataset and Benchmark
要約 長い形式のビデオを理解するための現在のデータセットは、ビデオから 1 つま … 続きを読む
Efficient Vision-Language Pre-training by Cluster Masking
要約 我々は、学習された表現の品質とトレーニング速度を向上させる、視覚言語対比学 … 続きを読む
カテゴリー: cs.CV
Efficient Vision-Language Pre-training by Cluster Masking はコメントを受け付けていません
The RoboDrive Challenge: Drive Anytime Anywhere in Any Condition
要約 自動運転の分野では、車両を安全に配備するには、物流外の状況下での堅牢な認識 … 続きを読む
PARDEN, Can You Repeat That? Defending against Jailbreaks via Repetition
要約 大規模言語モデル (LLM) は、多くの自然言語処理タスクで成功を収めてい … 続きを読む