-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年3月
JORA: JAX Tensor-Parallel LoRA Library for Retrieval Augmented Fine-Tuning
要約 検索ベースのタスク、特に検索拡張生成 (RAG) における大規模言語モデル … 続きを読む
SmartRefine: A Scenario-Adaptive Refinement Framework for Efficient Motion Prediction
要約 自動運転車 (AV) が動的で人間とロボットが混在する環境で安全に動作する … 続きを読む
Meta-Prompting for Automating Zero-shot Visual Recognition with LLMs
要約 大規模言語モデル (LLM) で生成されたカテゴリ固有のプロンプトのプロン … 続きを読む
DynamicGlue: Epipolar and Time-Informed Data Association in Dynamic Environments using Graph Neural Networks
要約 静的環境の想定は、SLAM などの多くの幾何学的なコンピューター ビジョン … 続きを読む
ECAMP: Entity-centered Context-aware Medical Vision Language Pre-training
要約 医療視覚言語の事前トレーニングは大幅に進歩したにもかかわらず、既存の手法で … 続きを読む
カテゴリー: cs.CV
ECAMP: Entity-centered Context-aware Medical Vision Language Pre-training はコメントを受け付けていません
KorNAT: LLM Alignment Benchmark for Korean Social Values and Common Knowledge
要約 大規模言語モデル (LLM) を特定の国で効果的に導入するには、その国の文 … 続きを読む
カテゴリー: cs.CL
KorNAT: LLM Alignment Benchmark for Korean Social Values and Common Knowledge はコメントを受け付けていません
Multi-View Video-Based Learning: Leveraging Weak Labels for Frame-Level Perception
要約 マルチビュービデオを受け入れるビデオベースのアクション認識モデルをトレーニ … 続きを読む
カテゴリー: cs.CV
Multi-View Video-Based Learning: Leveraging Weak Labels for Frame-Level Perception はコメントを受け付けていません
Urban Scene Diffusion through Semantic Occupancy Map
要約 無制限の 3D シーンの生成は、大規模なシーンの理解とシミュレーションにと … 続きを読む
カテゴリー: cs.CV
Urban Scene Diffusion through Semantic Occupancy Map はコメントを受け付けていません
VIHE: Virtual In-Hand Eye Transformer for 3D Robotic Manipulation
要約 この研究では、アクションを意識したビュー レンダリングを通じて 3D 操作 … 続きを読む
カテゴリー: cs.RO
VIHE: Virtual In-Hand Eye Transformer for 3D Robotic Manipulation はコメントを受け付けていません
WIA-LD2ND: Wavelet-based Image Alignment for Self-supervised Low-Dose CT Denoising
要約 臨床検査および診断において、低線量コンピュータ断層撮影 (LDCT) は、 … 続きを読む