-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
Hear the Scene: Audio-Enhanced Text Spotting
要約 シーン テキスト スポッティングの最近の進歩は、正確な位置の注釈に大きく依 … 続きを読む
カテゴリー: cs.CV
Hear the Scene: Audio-Enhanced Text Spotting はコメントを受け付けていません
SpecDETR: A Transformer-based Hyperspectral Point Object Detection Network
要約 ハイパースペクトル ターゲット検出 (HTD) は、ハイパースペクトル画像 … 続きを読む
カテゴリー: cs.CV
SpecDETR: A Transformer-based Hyperspectral Point Object Detection Network はコメントを受け付けていません
Causal Deep Learning
要約 私たちは、因果的ディープ ニューラル ネットワークのセットを導出します。そ … 続きを読む
World knowledge-enhanced Reasoning Using Instruction-guided Interactor in Autonomous Driving
要約 広範な世界知識を備えたマルチモーダル大規模言語モデル (MLLM) は、特 … 続きを読む
カテゴリー: cs.CV
World knowledge-enhanced Reasoning Using Instruction-guided Interactor in Autonomous Driving はコメントを受け付けていません
VLM2Vec: Training Vision-Language Models for Massive Multimodal Embedding Tasks
要約 埋め込みモデルは、意味的類似性、情報検索、クラスタリングなどのさまざまな下 … 続きを読む
Photoacoustic Iterative Optimization Algorithm with Shape Prior Regularization
要約 光音響イメージング (PAI) には、ノイズ、アーティファクト、まばらなサ … 続きを読む
カテゴリー: cs.CV, physics.optics
Photoacoustic Iterative Optimization Algorithm with Shape Prior Regularization はコメントを受け付けていません
Ethical-Lens: Curbing Malicious Usages of Open-Source Text-to-Image Models
要約 Midjourney や DALLE 3 などのイノベーションに代表される … 続きを読む
TOPIC: A Parallel Association Paradigm for Multi-Object Tracking under Complex Motions and Diverse Scenes
要約 ビデオ データとアルゴリズムは、マルチオブジェクト トラッキング (MOT … 続きを読む
カテゴリー: cs.CV
TOPIC: A Parallel Association Paradigm for Multi-Object Tracking under Complex Motions and Diverse Scenes はコメントを受け付けていません
Token Preference Optimization with Self-Calibrated Visual-Anchored Rewards for Hallucination Mitigation
要約 Direct Preference Optimization (DPO) … 続きを読む
カテゴリー: cs.CV
Token Preference Optimization with Self-Calibrated Visual-Anchored Rewards for Hallucination Mitigation はコメントを受け付けていません
HunyuanVideo: A Systematic Framework For Large Video Generative Models
要約 ビデオ生成における最近の進歩は、個人と業界の両方の日常生活に大きな影響を与 … 続きを読む
カテゴリー: cs.CV
HunyuanVideo: A Systematic Framework For Large Video Generative Models はコメントを受け付けていません