-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年4月
PointLoRA: Low-Rank Adaptation with Token Selection for Point Cloud Learning
要約 Point Cloudの自己教師の表現学習は、多様なタスク全体で事前に訓練 … 続きを読む
カテゴリー: cs.CV
PointLoRA: Low-Rank Adaptation with Token Selection for Point Cloud Learning はコメントを受け付けていません
LiveCC: Learning Video LLM with Streaming Speech Transcription at Scale
要約 最近のビデオ大規模な言語モデル(ビデオLLM)は、多くの場合、高価な人間の … 続きを読む
カテゴリー: cs.CV
LiveCC: Learning Video LLM with Streaming Speech Transcription at Scale はコメントを受け付けていません
A Scoping Review of Earth Observation and Machine Learning for Causal Inference: Implications for the Geography of Poverty
要約 衛星画像などの地球観測(EO)データは、特に機械学習(ML)とコンピュータ … 続きを読む
Evaluating Vision Language Models (VLMs) for Radiology: A Comprehensive Analysis
要約 自己監視技術を使用して膨大な量のデータで訓練された基礎モデルは、医学におけ … 続きを読む
LASER: A Neuro-Symbolic Framework for Learning Spatial-Temporal Scene Graphs with Weak Supervision
要約 ビデオから時空間シーングラフ(STSG)を学習するための監視されたアプロー … 続きを読む
Vision language models are unreliable at trivial spatial cognition
要約 ビジョン言語モデル(VLM)は、画像から関連する視覚空間情報を抽出するよう … 続きを読む
ForesightNav: Learning Scene Imagination for Efficient Exploration
要約 人間がどのように事前知識を活用して目に見えない環境をナビゲートしながら、探 … 続きを読む
Boosting Generative Image Modeling via Joint Image-Feature Synthesis
要約 潜在的な拡散モデル(LDMS)は高品質の画像生成を支配しますが、表現学習を … 続きを読む
カテゴリー: cs.CV
Boosting Generative Image Modeling via Joint Image-Feature Synthesis はコメントを受け付けていません
Describe Anything: Detailed Localized Image and Video Captioning
要約 画像やビデオで特定の領域の詳細かつ正確な説明を生成することは、ビジョン言語 … 続きを読む
From Reflection to Perfection: Scaling Inference-Time Optimization for Text-to-Image Diffusion Models via Reflection Tuning
要約 最近のテキスト間拡散モデルは、トレーニングデータとモデルパラメーターの広範 … 続きを読む
カテゴリー: cs.CV
From Reflection to Perfection: Scaling Inference-Time Optimization for Text-to-Image Diffusion Models via Reflection Tuning はコメントを受け付けていません