月別アーカイブ: 2024年6月

Regularizing Hidden States Enables Learning Generalizable Reward Model for LLMs

要約 人間の嗜好データに基づいてトレーニングされた報酬モデルは、人間のフィードバ … 続きを読む

カテゴリー: cs.AI, cs.CL | Regularizing Hidden States Enables Learning Generalizable Reward Model for LLMs はコメントを受け付けていません

COSMIC: Data Efficient Instruction-tuning For Speech In-Context Learning

要約 音声を大規模言語モデル (LLM) に統合し、その結果、命令追従/コンテキ … 続きを読む

カテゴリー: cs.AI, cs.CL, eess.AS | COSMIC: Data Efficient Instruction-tuning For Speech In-Context Learning はコメントを受け付けていません

Quantifying Variance in Evaluation Benchmarks

要約 評価ベンチマークは、大規模言語モデル (LLM) の機能を測定するための基 … 続きを読む

カテゴリー: cs.AI, cs.LG | Quantifying Variance in Evaluation Benchmarks はコメントを受け付けていません

GenH2R: Learning Generalizable Human-to-Robot Handover via Scalable Simulation, Demonstration, and Imitation

要約 この論文では、一般化可能なビジョンベースの人間からロボットへの (H2R) … 続きを読む

カテゴリー: cs.CV, cs.RO | GenH2R: Learning Generalizable Human-to-Robot Handover via Scalable Simulation, Demonstration, and Imitation はコメントを受け付けていません

Super-resolution multi-contrast unbiased eye atlases with deep probabilistic refinement

要約 目的: 目の形態、特に眼窩と視神経は集団によって大きく異なります。 これら … 続きを読む

カテゴリー: cs.CV, eess.IV | Super-resolution multi-contrast unbiased eye atlases with deep probabilistic refinement はコメントを受け付けていません

First Multi-Dimensional Evaluation of Flowchart Comprehension for Multimodal Large Language Models

要約 マルチモーダル大規模言語モデル (MLLM) テクノロジーの開発により、そ … 続きを読む

カテゴリー: cs.AI, cs.CV | First Multi-Dimensional Evaluation of Flowchart Comprehension for Multimodal Large Language Models はコメントを受け付けていません

DurLAR: A High-fidelity 128-channel LiDAR Dataset with Panoramic Ambient and Reflectivity Imagery for Multi-modal Autonomous Driving Applications

要約 パノラマ環境 (近赤外線) および反射率画像を備えた高忠実度 128 チャ … 続きを読む

カテゴリー: cs.CV, cs.RO | DurLAR: A High-fidelity 128-channel LiDAR Dataset with Panoramic Ambient and Reflectivity Imagery for Multi-modal Autonomous Driving Applications はコメントを受け付けていません

Long-Tailed 3D Detection via 2D Late Fusion

要約 Long-Tailed 3D Object Detection (LT3D … 続きを読む

カテゴリー: cs.CV, cs.RO | Long-Tailed 3D Detection via 2D Late Fusion はコメントを受け付けていません

Perturbing Attention Gives You More Bang for the Buck: Subtle Imaging Perturbations That Efficiently Fool Customized Diffusion Models

要約 拡散モデル (DM) は生成モデリングの新時代を迎え、高品質で現実的なデー … 続きを読む

カテゴリー: cs.CR, cs.CV, cs.LG | Perturbing Attention Gives You More Bang for the Buck: Subtle Imaging Perturbations That Efficiently Fool Customized Diffusion Models はコメントを受け付けていません

Enhancing Vision-Language Model with Unmasked Token Alignment

要約 CLIP に代表される、画像とテキストのペアに関する対照的な事前トレーニン … 続きを読む

カテゴリー: cs.CV | Enhancing Vision-Language Model with Unmasked Token Alignment はコメントを受け付けていません