-
最近の投稿
- Open-Vocabulary Action Localization with Iterative Visual Prompting
- Patterned Structure Muscle : Arbitrary Shaped Wire-driven Artificial Muscle Utilizing Anisotropic Flexible Structure for Musculoskeletal Robots
- The Power of Input: Benchmarking Zero-Shot Sim-To-Real Transfer of Reinforcement Learning Control Policies for Quadrotor Control
- PokeFlex: A Real-World Dataset of Deformable Objects for Robotics
- Toward a Better Understanding of Robot Energy Consumption in Agroecological Applications
-
最近のコメント
表示できるコメントはありません。 cs.AI (27918) cs.CL (21095) cs.CR (2183) cs.CV (34618) cs.LG (32650) cs.RO (16022) cs.SY (2484) eess.IV (4238) eess.SY (2478) stat.ML (4372)
「cs.AI」カテゴリーアーカイブ
Autoregressive Image Diffusion: Generation of Image Sequence and Application in MRI
要約 磁気共鳴画像法 (MRI) は、広く使用されている非侵襲性画像診断法です。 … 続きを読む
TTT-Unet: Enhancing U-Net with Test-Time Training Layers for biomedical image segmentation
要約 生物医学画像のセグメンテーションは、さまざまな病気を正確に診断および分析す … 続きを読む
MSDNet: Multi-Scale Decoder for Few-Shot Semantic Segmentation via Transformer-Guided Prototyping
要約 フューショット セマンティック セグメンテーションは、少数の注釈付きサンプ … 続きを読む
OmniGen: Unified Image Generation
要約 この研究では、統合画像生成のための新しい普及モデルである OmniGen … 続きを読む
RenderWorld: World Model with Self-Supervised 3D Label
要約 ビジョンのみによるエンドツーエンドの自動運転は、LiDAR とビジョンの融 … 続きを読む
Multi-OCT-SelfNet: Integrating Self-Supervised Learning with Multi-Source Data Fusion for Enhanced Multi-Class Retinal Disease Classification
要約 医療分野では、プライバシー上の懸念により、大規模なデータセットを取得するこ … 続きを読む
NVLM: Open Frontier-Class Multimodal LLMs
要約 NVLM 1.0 は、視覚言語タスクで最先端の結果を達成するフロンティアク … 続きを読む
Flash STU: Fast Spectral Transform Units
要約 このペーパーでは、スペクトル変換ユニットの効率的なオープンソース PyTo … 続きを読む
jina-embeddings-v3: Multilingual Embeddings With Task LoRA
要約 jina-embeddings-v3 は、5 億 7,000 万のパラメー … 続きを読む
Augmenting Automatic Speech Recognition Models with Disfluency Detection
要約 発話の流暢さは、会話や自発的な発話でよく発生します。 ただし、標準の自動音 … 続きを読む