-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年5月
Edge Detection based on Channel Attention and Inter-region Independence Test
要約 既存のエッジ検出手法は、ノイズの増幅や非サリエントなディテールの過剰な保持 … 続きを読む
カテゴリー: cs.CV
Edge Detection based on Channel Attention and Inter-region Independence Test はコメントを受け付けていません
Transferable Adversarial Attacks on Black-Box Vision-Language Models
要約 Vision Large Language Models(VLLM)は、テ … 続きを読む
GeloVec: Higher Dimensional Geometric Smoothing for Coherent Visual Feature Extraction in Image Segmentation
要約 本稿では、セマンティックセグメンテーションのための新しいCNNベースの注意 … 続きを読む
カテゴリー: cs.CV
GeloVec: Higher Dimensional Geometric Smoothing for Coherent Visual Feature Extraction in Image Segmentation はコメントを受け付けていません
Efficient Vocabulary-Free Fine-Grained Visual Recognition in the Age of Multimodal LLMs
要約 きめ細かな視覚認識(FGVR)には、視覚的に類似したカテゴリーを区別するこ … 続きを読む
MAVEN: Multi-modal Attention for Valence-Arousal Emotion Network
要約 感情表現は一過性のものであり、マルチモーダルな手がかりの時間的なずれがある … 続きを読む
Improving Editability in Image Generation with Layer-wise Memory
要約 現実の画像編集作業の多くは、望ましい結果を得るために複数の連続した編集を必 … 続きを読む
Towards Space Group Determination from EBSD Patterns: The Role of Deep Learning and High-throughput Dynamical Simulations
要約 新規材料の設計は、構造と物性の関係の理解にかかっている。しかし最近では、多 … 続きを読む
カテゴリー: cond-mat.mtrl-sci, cs.CV
Towards Space Group Determination from EBSD Patterns: The Role of Deep Learning and High-throughput Dynamical Simulations はコメントを受け付けていません
Any-to-Any Vision-Language Model for Multimodal X-ray Imaging and Radiological Report Generation
要約 生成モデルは、特にマルチモーダルアプリケーションにおいて、人工知能(AI) … 続きを読む
Evaluating Vision Language Model Adaptations for Radiology Report Generation in Low-Resource Languages
要約 ヘルスケアにおける人工知能の統合は、医療診断と患者ケアを改善するための新た … 続きを読む
VSC: Visual Search Compositional Text-to-Image Diffusion Model
要約 テキストから画像への拡散モデルは、自然言語によるプロンプトからリアルなビジ … 続きを読む
カテゴリー: cs.CV
VSC: Visual Search Compositional Text-to-Image Diffusion Model はコメントを受け付けていません