-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年5月
FlowDubber: Movie Dubbing with LLM-based Semantic-aware Learning and Flow Matching based Voice Enhancing
要約 ムービーダビングは、与えられた短い参照音声のボーカルの音色を維持しながら、 … 続きを読む
Diffusion-based Adversarial Purification from the Perspective of the Frequency Domain
要約 拡散に基づく敵対的浄化法は、順方向処理によって敵対的摂動を等方性ノイズの一 … 続きを読む
カテゴリー: cs.CV
Diffusion-based Adversarial Purification from the Perspective of the Frequency Domain はコメントを受け付けていません
MASH: Masked Anchored SpHerical Distances for 3D Shape Representation and Generation
要約 我々は、3D形状の新しいマルチビュー・パラメトリック表現であるMasked … 続きを読む
A Neural Architecture Search Method using Auxiliary Evaluation Metric based on ResNet Architecture
要約 本稿では、ResNetをフレームワークとして用いたニューラル・アーキテクチ … 続きを読む
FreeInsert: Disentangled Text-Guided Object Insertion in 3D Gaussian Scene without Spatial Priors
要約 3Dシーンにおけるテキスト駆動オブジェクト挿入は、自然言語による直感的なシ … 続きを読む
カテゴリー: cs.CV
FreeInsert: Disentangled Text-Guided Object Insertion in 3D Gaussian Scene without Spatial Priors はコメントを受け付けていません
Soybean Disease Detection via Interpretable Hybrid CNN-GNN: Integrating MobileNetV2 and GraphSAGE with Cross-Modal Attention
要約 大豆の葉の病害検出は農業生産性にとって重要であるが、従来の方法では視覚的に … 続きを読む
Project-and-Fuse: Improving RGB-D Semantic Segmentation via Graph Convolution Networks
要約 既存のRGB-Dセマンティックセグメンテーション手法の多くは、複雑なクロス … 続きを読む
カテゴリー: cs.CV
Project-and-Fuse: Improving RGB-D Semantic Segmentation via Graph Convolution Networks はコメントを受け付けていません
Insight-V: Exploring Long-Chain Visual Reasoning with Multimodal Large Language Models
要約 大規模言語モデル(LLM)は、より多くの推論を行うことで、強化された能力と … 続きを読む
カテゴリー: cs.CV
Insight-V: Exploring Long-Chain Visual Reasoning with Multimodal Large Language Models はコメントを受け付けていません
Monitoring morphometric drift in lifelong learning segmentation of the spinal cord
要約 脊髄のセグメンテーションから得られる形態計測指標は、脊髄に影響を及ぼす神経 … 続きを読む
カテゴリー: cs.CV
Monitoring morphometric drift in lifelong learning segmentation of the spinal cord はコメントを受け付けていません
Global Collinearity-aware Polygonizer for Polygonal Building Mapping in Remote Sensing
要約 本論文では、リモートセンシング画像から多角形の建物をマッピングするという課 … 続きを読む