-
最近の投稿
- Physical Reservoir Computing in Hook-Shaped Rover Wheel Spokes for Real-Time Terrain Identification
- Chain-of-Modality: Learning Manipulation Programs from Multimodal Human Videos with Vision-Language-Models
- Multi-Sensor Fusion-Based Mobile Manipulator Remote Control for Intelligent Smart Home Assistance
- Integration of a Graph-Based Path Planner and Mixed-Integer MPC for Robot Navigation in Cluttered Environments
- Demonstrating CavePI: Autonomous Exploration of Underwater Caves by Semantic Guidance
-
最近のコメント
表示できるコメントはありません。 cs.AI (36829) cs.CL (27883) cs.CV (42623) cs.HC (2814) cs.LG (41781) cs.RO (21795) cs.SY (3320) eess.IV (4979) eess.SY (3312) stat.ML (5469)
投稿者「jarxiv」のアーカイブ
Generative AI Act II: Test Time Scaling Drives Cognition Engineering
要約 生成AI(2020-2023)の「Act I」と呼ばれる可能性のある大規模 … 続きを読む
MIG: Automatic Data Selection for Instruction Tuning by Maximizing Information Gain in Semantic Space
要約 データの品質と多様性は、効果的な命令調整データセットの構築の鍵です。 %オ … 続きを読む
FocusNet: Transformer-enhanced Polyp Segmentation with Local and Pooling Attention
要約 大腸内視鏡検査は、結腸直腸ポリープの早期診断に不可欠です。 定期的なスクリ … 続きを読む
Unleashing the Power of CNN and Transformer for Balanced RGB-Event Video Recognition
要約 RGB-Eventデータに基づいたパターン認識は、新たに発生する研究トピッ … 続きを読む
ViG3D-UNet: Volumetric Vascular Connectivity-Aware Segmentation via 3D Vision Graph Representation
要約 正確な血管セグメンテーションは、冠動脈視覚化と冠動脈性心疾患の診断に不可欠 … 続きを読む
FocusTrack: A Self-Adaptive Local Sampling Algorithm for Efficient Anti-UAV Tracking
要約 Anti-UAV追跡は、ターゲットサイズの小さなサイズ、急激なカメラの動き … 続きを読む
Cross-Hierarchical Bidirectional Consistency Learning for Fine-Grained Visual Classification
要約 Fine-Grained Visual分類(FGVC)は、密接に関連するサ … 続きを読む
Compile Scene Graphs with Reinforcement Learning
要約 次のトークン予測は、大規模な言語モデル(LLMS)をトレーニングするための … 続きを読む
Visual Intention Grounding for Egocentric Assistants
要約 Visual Groundingは、テキストの説明を画像内のオブジェクトと … 続きを読む
SupResDiffGAN a new approach for the Super-Resolution task
要約 この作業では、超解像度タスクの生成的敵対ネットワーク(GANS)と拡散モデ … 続きを読む