-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年7月
Multi-Attribute Vision Transformers are Efficient and Robust Learners
要約 ビジョン トランスフォーマー (ViT) は、その誕生以来、幅広いタスクに … 続きを読む
カテゴリー: cs.CV
Multi-Attribute Vision Transformers are Efficient and Robust Learners はコメントを受け付けていません
AttentNet: Fully Convolutional 3D Attention for Lung Nodule Detection
要約 アテンション メカニズムの人気の高まりを背景に、スクイーズ アンド エキサ … 続きを読む
カテゴリー: cs.CV
AttentNet: Fully Convolutional 3D Attention for Lung Nodule Detection はコメントを受け付けていません
MLMT-CNN for Object Detection and Segmentation in Multi-layer and Multi-spectral Images
要約 マルチスペクトル画像から太陽活動領域 (AR) の位置を正確に特定すること … 続きを読む
カテゴリー: cs.CV, physics.space-ph
MLMT-CNN for Object Detection and Segmentation in Multi-layer and Multi-spectral Images はコメントを受け付けていません
Contrastive Learning with Counterfactual Explanations for Radiology Report Generation
要約 解剖学の内容が共通しているため、放射線画像と対応するレポートは高い類似性を … 続きを読む
カテゴリー: cs.CV
Contrastive Learning with Counterfactual Explanations for Radiology Report Generation はコメントを受け付けていません
A review on vision-based motion estimation
要約 接触センサーベースの運動測定と比較して、視覚ベースの運動測定は低コストと高 … 続きを読む
カテゴリー: cs.CV
A review on vision-based motion estimation はコメントを受け付けていません
EdgeSAM: Prompt-In-the-Loop Distillation for On-Device Deployment of SAM
要約 このペーパーでは、パフォーマンスの低下を最小限に抑えながらエッジ デバイス … 続きを読む
カテゴリー: cs.CV
EdgeSAM: Prompt-In-the-Loop Distillation for On-Device Deployment of SAM はコメントを受け付けていません
PD-TPE: Parallel Decoder with Text-guided Position Encoding for 3D Visual Grounding
要約 3D ビジュアル グラウンディングは、3D 点群シーンにおける自由形式の自 … 続きを読む
カテゴリー: cs.CV
PD-TPE: Parallel Decoder with Text-guided Position Encoding for 3D Visual Grounding はコメントを受け付けていません
Enhancing Layout Hotspot Detection Efficiency with YOLOv8 and PCA-Guided Augmentation
要約 このペーパーでは、デザイン ルール チェック (DRC) プロセスの効率と … 続きを読む
Discover-then-Name: Task-Agnostic Concept Bottlenecks via Automated Concept Discovery
要約 コンセプト ボトルネック モデル (CBM) は、まず画像を人間が理解でき … 続きを読む
M2D2M: Multi-Motion Generation from Text with Discrete Diffusion Models
要約 離散拡散モデルの長所を利用して、複数の動作のテキスト記述から人間の動作を生 … 続きを読む
カテゴリー: cs.CV
M2D2M: Multi-Motion Generation from Text with Discrete Diffusion Models はコメントを受け付けていません