月別アーカイブ: 2024年3月

JORA: JAX Tensor-Parallel LoRA Library for Retrieval Augmented Fine-Tuning

投稿日: 2024年3月20日作成者: jarxiv

要約検索ベースのタスク、特に検索拡張生成 (RAG) における大規模言語モデル … 続きを読む →

カテゴリー: cs.CL, cs.DC, cs.LG | コメントを受け付けていません

SmartRefine: A Scenario-Adaptive Refinement Framework for Efficient Motion Prediction

投稿日: 2024年3月20日作成者: jarxiv

要約自動運転車 (AV) が動的で人間とロボットが混在する環境で安全に動作する … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

Meta-Prompting for Automating Zero-shot Visual Recognition with LLMs

投稿日: 2024年3月20日作成者: jarxiv

要約大規模言語モデル (LLM) で生成されたカテゴリ固有のプロンプトのプロン … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

DynamicGlue: Epipolar and Time-Informed Data Association in Dynamic Environments using Graph Neural Networks

投稿日: 2024年3月20日作成者: jarxiv

要約静的環境の想定は、SLAM などの多くの幾何学的なコンピュータービジョン … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

ECAMP: Entity-centered Context-aware Medical Vision Language Pre-training

投稿日: 2024年3月20日作成者: jarxiv

要約医療視覚言語の事前トレーニングは大幅に進歩したにもかかわらず、既存の手法で … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

KorNAT: LLM Alignment Benchmark for Korean Social Values and Common Knowledge

投稿日: 2024年3月20日作成者: jarxiv

要約大規模言語モデル (LLM) を特定の国で効果的に導入するには、その国の文 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Multi-View Video-Based Learning: Leveraging Weak Labels for Frame-Level Perception

投稿日: 2024年3月20日作成者: jarxiv

要約マルチビュービデオを受け入れるビデオベースのアクション認識モデルをトレーニ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Urban Scene Diffusion through Semantic Occupancy Map

投稿日: 2024年3月20日作成者: jarxiv

要約無制限の 3D シーンの生成は、大規模なシーンの理解とシミュレーションにと … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

VIHE: Virtual In-Hand Eye Transformer for 3D Robotic Manipulation

投稿日: 2024年3月20日作成者: jarxiv

要約この研究では、アクションを意識したビューレンダリングを通じて 3D 操作 … 続きを読む →

カテゴリー: cs.RO | コメントを受け付けていません

WIA-LD2ND: Wavelet-based Image Alignment for Self-supervised Low-Dose CT Denoising

投稿日: 2024年3月20日作成者: jarxiv

要約臨床検査および診断において、低線量コンピュータ断層撮影 (LDCT) は、 … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

月別アーカイブ: 2024年3月

JORA: JAX Tensor-Parallel LoRA Library for Retrieval Augmented Fine-Tuning

SmartRefine: A Scenario-Adaptive Refinement Framework for Efficient Motion Prediction

Meta-Prompting for Automating Zero-shot Visual Recognition with LLMs

DynamicGlue: Epipolar and Time-Informed Data Association in Dynamic Environments using Graph Neural Networks

ECAMP: Entity-centered Context-aware Medical Vision Language Pre-training

KorNAT: LLM Alignment Benchmark for Korean Social Values and Common Knowledge

Multi-View Video-Based Learning: Leveraging Weak Labels for Frame-Level Perception

Urban Scene Diffusion through Semantic Occupancy Map

VIHE: Virtual In-Hand Eye Transformer for 3D Robotic Manipulation

WIA-LD2ND: Wavelet-based Image Alignment for Self-supervised Low-Dose CT Denoising

最近の投稿

最近のコメント

アーカイブ

カテゴリー