-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年8月
On Learnable Parameters of Optimal and Suboptimal Deep Learning Models
要約 私たちは、特に学習可能なパラメーター (重み) 統計、分布、ノードの相互作 … 続きを読む
Iterative Object Count Optimization for Text-to-image Diffusion Models
要約 私たちは、指定された数のオブジェクトを正確に生成するという、テキストから画 … 続きを読む
CMAB: A First National-Scale Multi-Attribute Building Dataset in China Derived from Open Source Data and GeoAI
要約 正確な都市分析、シミュレーション、政策更新には、屋上、高さ、向きなどの幾何 … 続きを読む
Enhancing Cross-Modal Medical Image Segmentation through Compositionality
要約 異なる画像モダリティによって生成される画像の解像度、コントラスト、解剖学的 … 続きを読む
カテゴリー: cs.CV
Enhancing Cross-Modal Medical Image Segmentation through Compositionality はコメントを受け付けていません
Predicting Gradient is Better: Exploring Self-Supervised Learning for SAR ATR with a Joint-Embedding Predictive Architecture
要約 増大する合成開口レーダー (SAR) データには、自己教師あり学習 (SS … 続きを読む
SOAP: Enhancing Spatio-Temporal Relation and Motion Information Capturing for Few-Shot Action Recognition
要約 動作認識の高フレームレート (HFR) ビデオは、時空間関係と動作情報密度 … 続きを読む
CluMo: Cluster-based Modality Fusion Prompt for Continual Learning in Visual Question Answering
要約 大規模ビジョン言語モデル (VLM) は、さまざまなアプリケーション ドメ … 続きを読む
JieHua Paintings Style Feature Extracting Model using Stable Diffusion with ControlNet
要約 この研究は、Jiehua の文体的特徴を抽出するための新しいアプローチ、つ … 続きを読む
Open-Ended 3D Point Cloud Instance Segmentation
要約 Open-Vocab 3D インスタンス セグメンテーション手法 (OV- … 続きを読む
DH-Bench: Probing Depth and Height Perception of Large Visual-Language Models
要約 幾何学的な理解は、私たちの環境をナビゲートし、環境と対話するために不可欠で … 続きを読む
カテゴリー: cs.CV
DH-Bench: Probing Depth and Height Perception of Large Visual-Language Models はコメントを受け付けていません