月別アーカイブ: 2024年3月

JORA: JAX Tensor-Parallel LoRA Library for Retrieval Augmented Fine-Tuning

要約 検索ベースのタスク、特に検索拡張生成 (RAG) における大規模言語モデル … 続きを読む

カテゴリー: cs.CL, cs.DC, cs.LG | JORA: JAX Tensor-Parallel LoRA Library for Retrieval Augmented Fine-Tuning はコメントを受け付けていません

SmartRefine: A Scenario-Adaptive Refinement Framework for Efficient Motion Prediction

要約 自動運転車 (AV) が動的で人間とロボットが混在する環境で安全に動作する … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | SmartRefine: A Scenario-Adaptive Refinement Framework for Efficient Motion Prediction はコメントを受け付けていません

Meta-Prompting for Automating Zero-shot Visual Recognition with LLMs

要約 大規模言語モデル (LLM) で生成されたカテゴリ固有のプロンプトのプロン … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Meta-Prompting for Automating Zero-shot Visual Recognition with LLMs はコメントを受け付けていません

DynamicGlue: Epipolar and Time-Informed Data Association in Dynamic Environments using Graph Neural Networks

要約 静的環境の想定は、SLAM などの多くの幾何学的なコンピューター ビジョン … 続きを読む

カテゴリー: cs.CV, cs.RO | DynamicGlue: Epipolar and Time-Informed Data Association in Dynamic Environments using Graph Neural Networks はコメントを受け付けていません

ECAMP: Entity-centered Context-aware Medical Vision Language Pre-training

要約 医療視覚言語の事前トレーニングは大幅に進歩したにもかかわらず、既存の手法で … 続きを読む

カテゴリー: cs.CV | ECAMP: Entity-centered Context-aware Medical Vision Language Pre-training はコメントを受け付けていません

KorNAT: LLM Alignment Benchmark for Korean Social Values and Common Knowledge

要約 大規模言語モデル (LLM) を特定の国で効果的に導入するには、その国の文 … 続きを読む

カテゴリー: cs.CL | KorNAT: LLM Alignment Benchmark for Korean Social Values and Common Knowledge はコメントを受け付けていません

Multi-View Video-Based Learning: Leveraging Weak Labels for Frame-Level Perception

要約 マルチビュービデオを受け入れるビデオベースのアクション認識モデルをトレーニ … 続きを読む

カテゴリー: cs.CV | Multi-View Video-Based Learning: Leveraging Weak Labels for Frame-Level Perception はコメントを受け付けていません

Urban Scene Diffusion through Semantic Occupancy Map

要約 無制限の 3D シーンの生成は、大規模なシーンの理解とシミュレーションにと … 続きを読む

カテゴリー: cs.CV | Urban Scene Diffusion through Semantic Occupancy Map はコメントを受け付けていません

VIHE: Virtual In-Hand Eye Transformer for 3D Robotic Manipulation

要約 この研究では、アクションを意識したビュー レンダリングを通じて 3D 操作 … 続きを読む

カテゴリー: cs.RO | VIHE: Virtual In-Hand Eye Transformer for 3D Robotic Manipulation はコメントを受け付けていません

WIA-LD2ND: Wavelet-based Image Alignment for Self-supervised Low-Dose CT Denoising

要約 臨床検査および診断において、低線量コンピュータ断層撮影 (LDCT) は、 … 続きを読む

カテゴリー: cs.CV, eess.IV | WIA-LD2ND: Wavelet-based Image Alignment for Self-supervised Low-Dose CT Denoising はコメントを受け付けていません