-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年8月
TetraDiffusion: Tetrahedral Diffusion Models for 3D Shape Generation
要約 確率的ノイズ除去拡散モデル (DDM) は、2D 画像生成の新しい標準を設 … 続きを読む
Integrating Edge Information into Ground Truth for the Segmentation of the Optic Disc and Cup from Fundus Images
要約 視神経乳頭とカップのセグメンテーションは、緑内障、心筋梗塞、糖尿病性網膜症 … 続きを読む
Multi-dimensional Parameter Space Exploration for Streamline-specific Tractography
要約 トラクトグラフィーの暗黙の課題の 1 つは、特定のデータセットまたはバンド … 続きを読む
Learning to Generate Parameters of ConvNets for Unseen Image Data
要約 一般的な畳み込みニューラル ネットワーク (ConvNet) は、大量の画 … 続きを読む
カテゴリー: cs.CV
Learning to Generate Parameters of ConvNets for Unseen Image Data はコメントを受け付けていません
Object-level Geometric Structure Preserving for Natural Image Stitching
要約 世界的に自然な構造で画像をつなぎ合わせるというテーマは、位置合わせと歪みの … 続きを読む
カテゴリー: cs.CV
Object-level Geometric Structure Preserving for Natural Image Stitching はコメントを受け付けていません
DeepInteraction++: Multi-Modality Interaction for Autonomous Driving
要約 既存の最高性能の自動運転システムは通常、信頼性の高いシーンの理解のためにマ … 続きを読む
カテゴリー: cs.CV
DeepInteraction++: Multi-Modality Interaction for Autonomous Driving はコメントを受け付けていません
DreamLCM: Towards High-Quality Text-to-3D Generation via Latent Consistency Model
要約 最近、SDS 手法の登場により、テキストを 3D に変換するタスクが急速に … 続きを読む
カテゴリー: cs.CV
DreamLCM: Towards High-Quality Text-to-3D Generation via Latent Consistency Model はコメントを受け付けていません
UNIC: Universal Classification Models via Multi-teacher Distillation
要約 事前トレーニングされたモデルはコモディティとなり、幅広いタスクで強力な結果 … 続きを読む
カテゴリー: cs.CV
UNIC: Universal Classification Models via Multi-teacher Distillation はコメントを受け付けていません
IllusionVQA: A Challenging Optical Illusion Dataset for Vision Language Models
要約 ビジョン言語モデル (VLM) の出現により、研究者は自然言語を使用してニ … 続きを読む
Loc4Plan: Locating Before Planning for Outdoor Vision and Language Navigation
要約 視覚と言語ナビゲーション (VLN) は、エージェントが指示を理解し、視覚 … 続きを読む