-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年7月
Patch-Prompt Aligned Bayesian Prompt Tuning for Vision-Language Models
要約 視覚言語の事前トレーニング済みモデルの下流アプリケーションでは、効果的なプ … 続きを読む
A Geometric Algorithm for Tubular Shape Reconstruction from Skeletal Representation
要約 骨格表現から管状形状を再構築するための新しいアプローチを紹介します。 私た … 続きを読む
Bytes Are All You Need: Transformers Operating Directly On File Bytes
要約 最新の深層学習アプローチでは、通常、モダリティ固有の処理が利用されます。 … 続きを読む
カテゴリー: cs.CV
Bytes Are All You Need: Transformers Operating Directly On File Bytes はコメントを受け付けていません
Evaluation of Deep Learning Semantic Segmentation for Land Cover Mapping on Multispectral, Hyperspectral and High Spatial Aerial Imagery
要約 気候変動の進行により、環境モニタリングにおいて土地被覆地図作成が緊急の必要 … 続きを読む
Towards objective and systematic evaluation of bias in artificial intelligence for medical imaging
要約 臨床タスク用に医療画像を使用してトレーニングされた人工知能 (AI) モデ … 続きを読む
Fine-tuning can cripple your foundation model; preserving features may be the solution
要約 事前トレーニングされた基礎モデルは、その膨大な容量と事前トレーニング中に膨 … 続きを読む
Distilling Knowledge from Text-to-Image Generative Models Improves Visio-Linguistic Reasoning in CLIP
要約 CLIP のような画像とテキストの対照モデルは、ゼロショット分類、画像とテ … 続きを読む
カテゴリー: cs.CV
Distilling Knowledge from Text-to-Image Generative Models Improves Visio-Linguistic Reasoning in CLIP はコメントを受け付けていません
Framing image registration as a landmark detection problem for label-noise-aware task representation (HitR)
要約 正確な画像位置合わせは生物医学画像解析において極めて重要であり、適切な位置 … 続きを読む
カテゴリー: cs.CV, eess.IV, physics.med-ph
Framing image registration as a landmark detection problem for label-noise-aware task representation (HitR) はコメントを受け付けていません
BMW Agents — A Framework For Task Automation Through Multi-Agent Collaboration
要約 大規模言語モデル (LLM) によって駆動される自律エージェントは、自動化 … 続きを読む
Text2Robot: Evolutionary Robot Design from Text Descriptions
要約 ロボットの設計は従来、コストと労働集約的でした。 自動化プロセスの進歩にも … 続きを読む