Which Demographics do LLMs Default to During Annotation?

要約

アノテーターの人口統計と文化的背景は、テキスト アノテーションで割り当てるラベルに影響します。たとえば、年配の女性は「兄弟」に宛てられたメッセージを読むのを不快に感じるかもしれませんが、10 代の男性はそれが適切であると考えるかもしれません。
したがって、社会のメンバーを過小評価しないためには、ラベルのバリエーションを認識することが重要です。
データ アノテーションに大規模言語モデル (LLM) を使用するという文脈で、この観察から 2 つの研究方向が開発されました。すなわち、(1) LLM のバイアスと固有の知識を研究すること、および (2) 人口統計情報でプロンプトを操作することによって出力に多様性を導入することです。

私たちはこれら 2 つの研究要素を組み合わせて、人口統計が与えられていない場合に LLM がどの人口統計に頼るかという質問をします。
この質問に答えるために、LLM が本質的にヒューマン アノテーターのどの属性を模倣しているかを評価します。
さらに、非人口統計条件付きプロンプトとプラセボ条件付きプロンプト (例: 「あなたは 5 番の家に住んでいるアノテーターです」) を、人口統計条件付きプロンプト (「あなたは 45 歳の男性で、ポライトネス アノテーションの専門家です」) と比較します。
. {インスタンス}をどのように評価しますか?’)。
私たちは、POPQUORN データセット上の礼儀正しさと不快さの注釈について、これらの質問を研究します。POPQUORN データセットは、これまで LLM ベースの分析には使用されていない、人口統計に基づく人間のラベルの変動を調査するために制御された方法で作成されたコーパスです。
私たちは、人口動態の促進において性別、人種、年齢に関連する顕著な影響を観察しました。これは、そのような影響が見出されなかった以前の研究とは対照的です。

要約(オリジナル)

Demographics and cultural background of annotators influence the labels they assign in text annotation — for instance, an elderly woman might find it offensive to read a message addressed to a ‘bro’, but a male teenager might find it appropriate. It is therefore important to acknowledge label variations to not under-represent members of a society. Two research directions developed out of this observation in the context of using large language models (LLM) for data annotations, namely (1) studying biases and inherent knowledge of LLMs and (2) injecting diversity in the output by manipulating the prompt with demographic information. We combine these two strands of research and ask the question to which demographics an LLM resorts to when no demographics is given. To answer this question, we evaluate which attributes of human annotators LLMs inherently mimic. Furthermore, we compare non-demographic conditioned prompts and placebo-conditioned prompts (e.g., ‘you are an annotator who lives in house number 5’) to demographics-conditioned prompts (‘You are a 45 year old man and an expert on politeness annotation. How do you rate {instance}’). We study these questions for politeness and offensiveness annotations on the POPQUORN data set, a corpus created in a controlled manner to investigate human label variations based on demographics which has not been used for LLM-based analyses so far. We observe notable influences related to gender, race, and age in demographic prompting, which contrasts with previous studies that found no such effects.

arxiv情報

著者 Johannes Schäfer,Aidan Combs,Christopher Bagdon,Jiahui Li,Nadine Probol,Lynn Greschner,Sean Papay,Yarik Menchaca Resendiz,Aswathy Velutharambath,Amelie Wührl,Sabine Weber,Roman Klinger
発行日 2024-10-14 14:22:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL | Which Demographics do LLMs Default to During Annotation? はコメントを受け付けていません

DCNet: A Data-Driven Framework for DVL Calibration

要約

自律型水中ビークル (AUV) は、さまざまな用途に使用される水中ロボット プラットフォームです。
AUV のナビゲーション ソリューションは、慣性センサーとドップラー速度ログ (DVL) の融合に大きく依存しており、後者は正確な速度更新を提供します。
正確なナビゲーションを保証するために、ミッションが誤差項の推定を開始する前に DVL キャリブレーションが実行されます。
キャリブレーション中、AUV は複雑な軌道をたどり、非線形推定フィルターを使用して誤差項を推定します。
このペーパーでは、革新的な方法で 2 次元コンボリューション カーネルを利用するデータ駆動型フレームワークである DCNet を紹介します。
DCNet と当社が提案する DVL 誤差モデルを使用して、迅速な校正手順を提供します。
これは、ほぼ等速の軌道に適用できます。
私たちが提案したアプローチをトレーニングしてテストするために、実際の DVL 記録された測定値を含む 276 分のデータセットが使用されました。
低パフォーマンスの DVL を使用した場合、ベースラインのアプローチと比較して、精度が平均 70% 向上し、キャリブレーション時間が 80% 向上することが実証されました。
これらの改良の結果、低コストの DVL を採用した AUV は、より高い精度とより短い校正時間を実現し、簡単なほぼ等速の校正軌道を適用することができます。
私たちの成果は、低コストで高精度の DVL を利用した海洋ロボット工学の新たな用途も開拓します。

要約(オリジナル)

Autonomous underwater vehicles (AUVs) are underwater robotic platforms used in a variety of applications. An AUV’s navigation solution relies heavily on the fusion of inertial sensors and Doppler velocity logs (DVL), where the latter delivers accurate velocity updates. To ensure accurate navigation, a DVL calibration is undertaken before the mission begins to estimate its error terms. During calibration, the AUV follows a complex trajectory and employs nonlinear estimation filters to estimate error terms. In this paper, we introduce DCNet, a data-driven framework that utilizes a two-dimensional convolution kernel in an innovative way. Using DCNet and our proposed DVL error model, we offer a rapid calibration procedure. This can be applied to a trajectory with a nearly constant velocity. To train and test our proposed approach a dataset of 276 minutes long with real DVL recorded measurements was used. We demonstrated an average improvement of 70% in accuracy and 80% improvement in calibration time, compared to the baseline approach, with a low-performance DVL. As a result of those improvements, an AUV employing a low-cost DVL, can achieve higher accuracy, shorter calibration time, and apply a simple nearly constant velocity calibration trajectory. Our results also open up new applications for marine robotics utilizing low-cost, high-accurate DVLs.

arxiv情報

著者 Zeev Yampolsky,Itzik Klein
発行日 2024-10-14 09:47:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO | DCNet: A Data-Driven Framework for DVL Calibration はコメントを受け付けていません

Learning Representations of Instruments for Partial Identification of Treatment Effects

要約

観察データから治療効果を信頼性高く推定することは、医学などの多くの分野において重要です。
ただし、因果推論の文献における標準的な仮定としての無交絡性に違反すると、推定は困難になります。
この研究では、任意の (潜在的に高次元の) 手段を活用して、条件付き平均治療効果 (CATE) の限界を推定します。
私たちの貢献は 3 つあります。 (1) CATE 上で有効な境界を生み出すために、機器を離散表現空間にマッピングすることにより、部分的な識別のための新しいアプローチを提案します。
これは、現実世界のアプリケーションで信頼性の高い意思決定を行うために非常に重要です。
(2) 潜在的な機器空間の調整された神経分割を使用して、厳密な境界を学習する 2 段階の手順を導き出します。
その結果、数値近似や敵対的トレーニングによる不安定性の問題が回避されます。
さらに、私たちの手順は、有限サンプル設定での推定の分散を減らし、より信頼性の高い推定値を生成することを目的としています。
(3) 私たちの手順が推定の分散を減らしながら有効な範囲を取得することを理論的に示します。
さらに、さまざまな設定での有効性を実証するために広範な実験を実施します。
全体として、私たちの手順は、潜在的に高次元の手段(たとえば、メンデルのランダム化など)を利用するための新しい道を実践者に提供します。

要約(オリジナル)

Reliable estimation of treatment effects from observational data is important in many disciplines such as medicine. However, estimation is challenging when unconfoundedness as a standard assumption in the causal inference literature is violated. In this work, we leverage arbitrary (potentially high-dimensional) instruments to estimate bounds on the conditional average treatment effect (CATE). Our contributions are three-fold: (1) We propose a novel approach for partial identification through a mapping of instruments to a discrete representation space so that we yield valid bounds on the CATE. This is crucial for reliable decision-making in real-world applications. (2) We derive a two-step procedure that learns tight bounds using a tailored neural partitioning of the latent instrument space. As a result, we avoid instability issues due to numerical approximations or adversarial training. Furthermore, our procedure aims to reduce the estimation variance in finite-sample settings to yield more reliable estimates. (3) We show theoretically that our procedure obtains valid bounds while reducing estimation variance. We further perform extensive experiments to demonstrate the effectiveness across various settings. Overall, our procedure offers a novel path for practitioners to make use of potentially high-dimensional instruments (e.g., as in Mendelian randomization).

arxiv情報

著者 Jonas Schweisthal,Dennis Frauen,Maresa Schröder,Konstantin Hess,Niki Kilbertus,Stefan Feuerriegel
発行日 2024-10-14 08:04:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, stat.ML | Learning Representations of Instruments for Partial Identification of Treatment Effects はコメントを受け付けていません

LIME-Eval: Rethinking Low-light Image Enhancement Evaluation via Object Detection

要約

強調の性質、つまり対になったグラウンドトゥルース情報が存在しないため、最近では、低照度画像強調のパフォーマンスを評価するために高レベルの視覚タスクが使用されています。
広く使用されている方法は、さまざまな候補によって強化された低照度画像でトレーニングされたオブジェクト検出器が、注釈付きの意味ラベルに関してどの程度正確に実行できるかを確認することです。
この論文では、まず、前述のアプローチが一般にオーバーフィッティングの傾向があり、そのため測定の信頼性が低下することを示します。
適切な評価指標を求めて、私たちは LIME-Bench を提案します。これは、低照度補正に対する人間の好みを収集するように設計された初のオンライン ベンチマーク プラットフォームであり、人間の知覚と自動化された評価指標の間の相関関係を検証するための貴重なデータセットを提供します。
次に、オブジェクトの注釈なしで標準照明データセットで事前トレーニングされた検出器を利用する新しい評価フレームワークである LIME-Eval をカスタマイズして、強化された画像の品質を判断します。
出力信頼マップの精度を評価するためにエネルギーベースの戦略を採用することにより、LIME-Eval は検出器の再トレーニングに関連するバイアスをバイパスし、薄暗い画像に対するアノテーションへの依存を同時に回避できます。
LIME-Eval の有効性を明らかにするために、包括的な実験が提供されます。
当社のベンチマーク プラットフォーム (https://huggingface.co/spaces/lime-j/eval) とコード (https://github.com/lime-j/lime-eval) はオンラインで入手できます。

要約(オリジナル)

Due to the nature of enhancement–the absence of paired ground-truth information, high-level vision tasks have been recently employed to evaluate the performance of low-light image enhancement. A widely-used manner is to see how accurately an object detector trained on enhanced low-light images by different candidates can perform with respect to annotated semantic labels. In this paper, we first demonstrate that the mentioned approach is generally prone to overfitting, and thus diminishes its measurement reliability. In search of a proper evaluation metric, we propose LIME-Bench, the first online benchmark platform designed to collect human preferences for low-light enhancement, providing a valuable dataset for validating the correlation between human perception and automated evaluation metrics. We then customize LIME-Eval, a novel evaluation framework that utilizes detectors pre-trained on standard-lighting datasets without object annotations, to judge the quality of enhanced images. By adopting an energy-based strategy to assess the accuracy of output confidence maps, our LIME-Eval can simultaneously bypass biases associated with retraining detectors and circumvent the reliance on annotations for dim images. Comprehensive experiments are provided to reveal the effectiveness of our LIME-Eval. Our benchmark platform (https://huggingface.co/spaces/lime-j/eval) and code (https://github.com/lime-j/lime-eval) are available online.

arxiv情報

著者 Mingjia Li,Hao Zhao,Xiaojie Guo
発行日 2024-10-14 07:43:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV | LIME-Eval: Rethinking Low-light Image Enhancement Evaluation via Object Detection はコメントを受け付けていません

Unintentional Unalignment: Likelihood Displacement in Direct Preference Optimization

要約

Direct Preference Optimization (DPO) とそのバリアントは、言語モデルを人間の好みに合わせるために使用されることが増えています。
これらの方法は、好ましくない応答と比べて好ましい応答をより頻繁に生成するようにモデルを学習させるように設計されていますが、これまでの研究では、訓練中に好ましい応答の可能性がしばしば低下することが観察されています。
現在の研究は、尤度変位と呼ばれるこの直観に反する現象の原因と影響を明らかにしています。
我々は、尤度のずれが壊滅的な影響を及ぼし、確率の質量を好ましい応答から反対の意味の応答にシフトさせる可能性があることを実証します。
簡単な例として、$\texttt{Never}$ よりも $\texttt{No}$ を優先するようにモデルをトレーニングすると、$\texttt{Yes}$ の確率が大幅に増加します。
さらに、安全でないプロンプトを拒否するようにモデルを調整する場合、確率質量を好ましい拒否反応から有害な反応にシフトすることによって(たとえば、ラマ-3-8B-命令の拒否率を74.4から低下させる)、そのようなずれが意図せずに不調整につながる可能性があることを示します。
%から33.4%)。
我々は、中心化された隠れ埋め込み類似性 (CHES) スコアによって測定されるように、尤度の変位が類似の埋め込みを誘発する選好によって駆動されることを理論的に特徴付けます。
経験的に、CHES スコアを使用すると、特定のデータセット内の尤度の変位に最も寄与するトレーニング サンプルを特定できます。
これらのサンプルをフィルタリングして除去することで、実験における意図しない不整列が効果的に軽減されました。
より広範に、私たちの結果は、十分に明確な好みを持つデータを厳選することの重要性を強調しており、そのために CHES スコアが価値があると私たちは考えています。

要約(オリジナル)

Direct Preference Optimization (DPO) and its variants are increasingly used for aligning language models with human preferences. Although these methods are designed to teach a model to generate preferred responses more frequently relative to dispreferred responses, prior work has observed that the likelihood of preferred responses often decreases during training. The current work sheds light on the causes and implications of this counter-intuitive phenomenon, which we term likelihood displacement. We demonstrate that likelihood displacement can be catastrophic, shifting probability mass from preferred responses to responses with an opposite meaning. As a simple example, training a model to prefer $\texttt{No}$ over $\texttt{Never}$ can sharply increase the probability of $\texttt{Yes}$. Moreover, when aligning the model to refuse unsafe prompts, we show that such displacement can unintentionally lead to unalignment, by shifting probability mass from preferred refusal responses to harmful responses (e.g., reducing the refusal rate of Llama-3-8B-Instruct from 74.4% to 33.4%). We theoretically characterize that likelihood displacement is driven by preferences that induce similar embeddings, as measured by a centered hidden embedding similarity (CHES) score. Empirically, the CHES score enables identifying which training samples contribute most to likelihood displacement in a given dataset. Filtering out these samples effectively mitigated unintentional unalignment in our experiments. More broadly, our results highlight the importance of curating data with sufficiently distinct preferences, for which we believe the CHES score may prove valuable.

arxiv情報

著者 Noam Razin,Sadhika Malladi,Adithya Bhaskar,Danqi Chen,Sanjeev Arora,Boris Hanin
発行日 2024-10-14 02:22:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.LG, stat.ML | Unintentional Unalignment: Likelihood Displacement in Direct Preference Optimization はコメントを受け付けていません

Simplified POMDP Planning with an Alternative Observation Space and Formal Performance Guarantees

要約

部分的に観測可能な領域における不確実性の下でのオンライン計画は、ロボット工学と AI において不可欠な機能です。
部分観察可能なマルコフ決定プロセス (POMDP) は、この困難な状況における意思決定の問題に対処するための数学的原理に基づいたフレームワークです。
ただし、POMDP の最適解を見つけるには計算コストがかかり、小さな問題に対してのみ実現可能です。
この研究では、代替のよりコンパクトな観測空間と簡素化されたモデルに切り替えることで、POMDP を簡素化する新しい方法を提供し、正式なパフォーマンス保証を備えた計画の迅速化を実現します。
ビリーフ ツリー トポロジの概念を導入します。これは、元の観測空間と代替の観測空間とモデルを使用するツリー内のレベルと分岐をエンコードします。
各ビリーフ ツリー トポロジには、独自のポリシー スペースとプランニング パフォーマンスが付属しています。
私たちの主な貢献は、元の POMDP の最適な Q 関数と、対応する単純化されたポリシー空間を備えた特定のトポロジーによって定義された単純化されたツリーとの間の境界を導出することです。
これらの境界は、元の POMDP の最適なアクションが決定されるまで、異なるツリー トポロジ間の適応メカニズムとして使用されます。
さらに、代替の観察空間とモデルが状態が完全に観察可能な設定に対応する、フレームワークの特定のインスタンス化を検討します。
正確および近似の POMDP ソルバーを考慮して、シミュレーションでアプローチを評価し、ソリューションの品質を維持しながら大幅な高速化を実証します。
私たちは、この取り組みにより、正式なパフォーマンス保証を備えたオンライン POMDP 計画に新たなエキサイティングな道が開かれると信じています。

要約(オリジナル)

Online planning under uncertainty in partially observable domains is an essential capability in robotics and AI. The partially observable Markov decision process (POMDP) is a mathematically principled framework for addressing decision-making problems in this challenging setting. However, finding an optimal solution for POMDPs is computationally expensive and is feasible only for small problems. In this work, we contribute a novel method to simplify POMDPs by switching to an alternative, more compact, observation space and simplified model to speedup planning with formal performance guarantees. We introduce the notion of belief tree topology, which encodes the levels and branches in the tree that use the original and alternative observation space and models. Each belief tree topology comes with its own policy space and planning performance. Our key contribution is to derive bounds between the optimal Q-function of the original POMDP and the simplified tree defined by a given topology with a corresponding simplified policy space. These bounds are then used as an adaptation mechanism between different tree topologies until the optimal action of the original POMDP can be determined. Further, we consider a specific instantiation of our framework, where the alternative observation space and model correspond to a setting where the state is fully observable. We evaluate our approach in simulation, considering exact and approximate POMDP solvers and demonstrating a significant speedup while preserving solution quality. We believe this work opens new exciting avenues for online POMDP planning with formal performance guarantees.

arxiv情報

著者 Da Kong,Vadim Indelman
発行日 2024-10-11 04:58:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Simplified POMDP Planning with an Alternative Observation Space and Formal Performance Guarantees はコメントを受け付けていません

FREA: Feasibility-Guided Generation of Safety-Critical Scenarios with Reasonable Adversariality

要約

安全性が重要なシナリオを生成することは、不可欠であるものの、大規模に収集することが困難であり、自動運転車 (AV) の堅牢性を評価する効果的な方法となります。
既存の手法は、シナリオの自然性を維持しながら敵対性を最適化することに焦点を当てており、データ駆動型のアプローチを通じてバランスを達成することを目指しています。
ただし、敵対性の適切な上限がないと、シナリオが過剰な敵対性を示し、回避できない衝突が発生する可能性があります。
この論文では、敵対的シナリオの合理性を確保するためのガイダンスとして AV の最大実現可能領域 (LFR) を組み込んだ、新しいセーフティ クリティカル シナリオ生成手法である FREA を紹介します。
具体的には、FREA は最初にオフライン データセットから AV の LFR を事前計算します。
その後、シーンのクリティカル バックグラウンド ビークル (CBV) を制御する合理的な敵対的ポリシーを学習し、新しい実現可能性に依存する敵対的目的関数を最大化することで、敵対的でありながら AV 実現可能なシナリオを生成します。
広範な実験により、FREA がセーフティ クリティカルなシナリオを効果的に生成し、AV の実現可能性を確保しながら、かなりのニアミス イベントを生成できることが示されています。
一般化分析では、さまざまな代替 AV 手法およびトラフィック環境にわたる AV テストにおける FREA の堅牢性も確認されています。

要約(オリジナル)

Generating safety-critical scenarios, which are essential yet difficult to collect at scale, offers an effective method to evaluate the robustness of autonomous vehicles (AVs). Existing methods focus on optimizing adversariality while preserving the naturalness of scenarios, aiming to achieve a balance through data-driven approaches. However, without an appropriate upper bound for adversariality, the scenarios might exhibit excessive adversariality, potentially leading to unavoidable collisions. In this paper, we introduce FREA, a novel safety-critical scenarios generation method that incorporates the Largest Feasible Region (LFR) of AV as guidance to ensure the reasonableness of the adversarial scenarios. Concretely, FREA initially pre-calculates the LFR of AV from offline datasets. Subsequently, it learns a reasonable adversarial policy that controls the scene’s critical background vehicles (CBVs) to generate adversarial yet AV-feasible scenarios by maximizing a novel feasibility-dependent adversarial objective function. Extensive experiments illustrate that FREA can effectively generate safety-critical scenarios, yielding considerable near-miss events while ensuring AV’s feasibility. Generalization analysis also confirms the robustness of FREA in AV testing across various surrogate AV methods and traffic environments.

arxiv情報

著者 Keyu Chen,Yuheng Lei,Hao Cheng,Haoran Wu,Wenchao Sun,Sifa Zheng
発行日 2024-10-11 05:32:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO | FREA: Feasibility-Guided Generation of Safety-Critical Scenarios with Reasonable Adversariality はコメントを受け付けていません

Enhanced Robot Planning and Perception through Environment Prediction

要約

移動ロボットは地図に依存して環境内を移動します。
地図がない場合、ロボットは環境内を移動しながら部分的な観察に基づいてオンラインで地図を構築する必要があります。
従来の方法では、直接観察のみを使用してマップを作成します。
対照的に、人間は観察された環境のパターンを特定し、今後何が起こるかを情報に基づいて推測します。
環境が複雑なため、これらのパターンを明示的にモデル化することは困難です。
ただし、これらの複雑なモデルは、大規模なトレーニング データと組み合わせて学習ベースの方法を使用すると、適切に近似できます。
パターンを抽出することで、ロボットは直接の観察と今後の予測を利用して、未知の環境をより適切にナビゲートできるようになります。
この論文では、効率的かつ安全な操作のための予測機能を移動ロボットに装備するための、いくつかの学習ベースの方法を紹介します。
論文の最初の部分では、環境内の幾何学的パターンと構造パターンを使用して予測する方法を学びます。
部分的に観測された地図は、観測されていない領域を正確に予測するための貴重な手がかりを提供します。
まず、さまざまなオーバーヘッド マップ モダリティに対してこれらのパターンをモデル化するための一般的な学習ベースのアプローチの機能を実証します。
次に、近隣領域の 2D 占有率を予測することで、屋内環境でのナビゲーションを高速化するためにタスク固有の学習を採用します。
このアイデアは、オブジェクトを再構築するための 3D 点群表現にさらに拡張されます。
部分的なビューのみからオブジェクト全体の形状を予測する私たちのアプローチは、効率的な次善のビュー計画への道を開きます。
論文の第 2 部では、環境内の時空間パターンを使用して予測する方法を学びます。
私たちは、ロボット間の分散型調整を求めるターゲット追跡やカバレージなどの動的タスクに焦点を当てています。
まず、よりスケーラブルで高速な推論のためにグラフ ニューラル ネットワークを使用する方法を示します。

要約(オリジナル)

Mobile robots rely on maps to navigate through an environment. In the absence of any map, the robots must build the map online from partial observations as they move in the environment. Traditional methods build a map using only direct observations. In contrast, humans identify patterns in the observed environment and make informed guesses about what to expect ahead. Modeling these patterns explicitly is difficult due to the complexity of the environments. However, these complex models can be approximated well using learning-based methods in conjunction with large training data. By extracting patterns, robots can use direct observations and predictions of what lies ahead to better navigate an unknown environment. In this dissertation, we present several learning-based methods to equip mobile robots with prediction capabilities for efficient and safer operation. In the first part of the dissertation, we learn to predict using geometrical and structural patterns in the environment. Partially observed maps provide invaluable cues for accurately predicting the unobserved areas. We first demonstrate the capability of general learning-based approaches to model these patterns for a variety of overhead map modalities. Then we employ task-specific learning for faster navigation in indoor environments by predicting 2D occupancy in the nearby regions. This idea is further extended to 3D point cloud representation for object reconstruction. Predicting the shape of the full object from only partial views, our approach paves the way for efficient next-best-view planning. In the second part of the dissertation, we learn to predict using spatiotemporal patterns in the environment. We focus on dynamic tasks such as target tracking and coverage where we seek decentralized coordination between robots. We first show how graph neural networks can be used for more scalable and faster inference.

arxiv情報

著者 Vishnu Dutt Sharma
発行日 2024-10-11 06:31:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Enhanced Robot Planning and Perception through Environment Prediction はコメントを受け付けていません

FlowRetrieval: Flow-Guided Data Retrieval for Few-Shot Imitation Learning

要約

少数ショット模倣学習は、少量のタスク固有のデモンストレーションのみに依存して、特定の下流タスクにポリシーを効率的に適応させます。
検索ベースの手法には、ポリシーを学習するときに、関連する過去の経験を取得してこの対象データを増強することが約束されています。
しかし、既存のデータ検索方法は 2 つの極端な方法に分類されます。1 つは、以前のデータに視覚的に類似したシーンによる正確な動作の存在に依存するものであり、これを想定するのは現実的ではありません。
または、タスクの高級言語記述の意味論的な類似性に基づいて取得しますが、これは、ポリシー学習に関連するデータを取得するためのより重要な要素であることが多い、タスク間で共有される低レベルの動作や動作についてはあまり有益ではない可能性があります。
この研究では、膨大な量のタスク間データの動きの類似性を活用して、ターゲット タスクの数ショット模倣学習を改善する方法を調査します。
私たちの重要な洞察は、動き類似データには、数ショットの適応中に活用できるアクションやオブジェクトの相互作用の効果に関する豊富な情報が含まれているということです。
我々は、オプティカルフロー表現を活用して、過去のデータから対象タスクに類似した動作を抽出し、そのデータから最大限の利益を得ることができるポリシーの学習を導くアプローチであるFlowRetrievalを提案します。
私たちの結果は、FlowRetrieval がシミュレートされたドメインと現実世界のドメインにわたって従来の方法を大幅に上回り、最良の検索ベースの従来の方法よりも平均で 27% 高い成功率を達成していることを示しています。
本物の Franka Emika ロボットを使用した Pen-in-Cup タスクでは、FlowRetrieval は、以前のすべてのデータとターゲット データから学習するベースライン模倣学習手法の 3.7 倍のパフォーマンスを達成しました。
ウェブサイト: https://flow-retrieval.github.io

要約(オリジナル)

Few-shot imitation learning relies on only a small amount of task-specific demonstrations to efficiently adapt a policy for a given downstream tasks. Retrieval-based methods come with a promise of retrieving relevant past experiences to augment this target data when learning policies. However, existing data retrieval methods fall under two extremes: they either rely on the existence of exact behaviors with visually similar scenes in the prior data, which is impractical to assume; or they retrieve based on semantic similarity of high-level language descriptions of the task, which might not be that informative about the shared low-level behaviors or motions across tasks that is often a more important factor for retrieving relevant data for policy learning. In this work, we investigate how we can leverage motion similarity in the vast amount of cross-task data to improve few-shot imitation learning of the target task. Our key insight is that motion-similar data carries rich information about the effects of actions and object interactions that can be leveraged during few-shot adaptation. We propose FlowRetrieval, an approach that leverages optical flow representations for both extracting similar motions to target tasks from prior data, and for guiding learning of a policy that can maximally benefit from such data. Our results show FlowRetrieval significantly outperforms prior methods across simulated and real-world domains, achieving on average 27% higher success rate than the best retrieval-based prior method. In the Pen-in-Cup task with a real Franka Emika robot, FlowRetrieval achieves 3.7x the performance of the baseline imitation learning technique that learns from all prior and target data. Website: https://flow-retrieval.github.io

arxiv情報

著者 Li-Heng Lin,Yuchen Cui,Amber Xie,Tianyu Hua,Dorsa Sadigh
発行日 2024-10-11 07:17:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO | FlowRetrieval: Flow-Guided Data Retrieval for Few-Shot Imitation Learning はコメントを受け付けていません

Energy-Cautious Designation of Kinematic Parameters for a Sustainable Parallel-Serial Heavy-Duty Manipulator Driven by Electromechanical Linear Actuator

要約

気候変動と戦うための重要な戦略である電動化は産業を変革しており、次にオフハイウェイ機械 (OHM) が内燃機関と油圧作動から持続可能な完全電化機械に移行することになります。
電気機械リニア アクチュエータ (EMLA) は、優れた効率、安全性、メンテナンスの軽減を実現し、高性能の自律動作の膨大な可能性を解き放ちます。
ただし、重要な課題は、EMLA 統合のための OHM のオンボードマニピュレータの運動学的パラメータを最適化し、作動システムの機能を最大限に活用し、その性能を最大化することにあります。
この研究では、OHM マニピュレータで一般的に採用されている一般的な閉じた運動学的チェーン構成の構造最適化を掘り下げることで、この課題に取り組んでいます。
私たちのアプローチは、エネルギー消費を削減しながらマニピュレーターの既存の機能を維持し、持続可能で高性能なロボット化 OHM が進化できる産業オートメーションのより環境に優しい未来への道を開くことを目的としています。
私たちの方法論の実現可能性は、バッテリー電気自動車に搭載された市販の並列直列高耐久マニピュレーターで得られたシミュレーション結果によって検証されます。
この結果は、システム全体のエネルギー消費を最小限に抑えながら、従来の油圧アクチュエータの EMLA への置き換えを容易にするために運動学的パラメータを変更する際の当社のアプローチの有効性を示しています。

要約(オリジナル)

Electrification, a key strategy in combating climate change, is transforming industries, and off-highway machines (OHM) will be next to transition from combustion engines and hydraulic actuation to sustainable fully electrified machines. Electromechanical linear actuators (EMLAs) offer superior efficiency, safety, and reduced maintenance, and they unlock vast potential for high-performance autonomous operations. However, a key challenge lies in optimizing the kinematic parameters of OHMs’ on-board manipulators for EMLA integration to exploit the full capabilities of actuation systems and maximize their performance. This work addresses this challenge by delving into the structural optimization of a prevalent closed kinematic chain configuration commonly employed in OHM manipulators. Our approach aims to retain the manipulator’s existing capabilities while reducing its energy expenditure, paving the way for a greener future in industrial automation, one in which sustainable and high-performing robotized OHMs can evolve. The feasibility of our methodology is validated through simulation results obtained on a commercially available parallel-serial heavy-duty manipulator mounted on a battery electric vehicle. The results demonstrate the efficacy of our approach in modifying kinematic parameters to facilitate the replacement of conventional hydraulic actuators with EMLAs, all while minimizing the overall energy consumption of the system.

arxiv情報

著者 Alvaro Paz,Mohammad Bahari,Jouni Mattila
発行日 2024-10-11 07:55:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | Energy-Cautious Designation of Kinematic Parameters for a Sustainable Parallel-Serial Heavy-Duty Manipulator Driven by Electromechanical Linear Actuator はコメントを受け付けていません