cs.AI」カテゴリーアーカイブ

Iterative Length-Regularized Direct Preference Optimization: A Case Study on Improving 7B Language Models to GPT-4 Level

要約 言語モデルを人間の好みに合わせるための標準的な方法である直接好み最適化 ( … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Iterative Length-Regularized Direct Preference Optimization: A Case Study on Improving 7B Language Models to GPT-4 Level はコメントを受け付けていません

Embodied Instruction Following in Unknown Environments

要約 身体化されたエージェントが自然言語から人間による複雑な指示を完了できるよう … 続きを読む

カテゴリー: cs.AI, cs.RO | Embodied Instruction Following in Unknown Environments はコメントを受け付けていません

WPO: Enhancing RLHF with Weighted Preference Optimization

要約 ヒューマン フィードバックからの強化学習 (RLHF) は、大規模言語モデ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | WPO: Enhancing RLHF with Weighted Preference Optimization はコメントを受け付けていません

Language Modeling with Editable External Knowledge

要約 世界が変われば、それについて人間が書く文章も変わります。 これらの変更を反 … 続きを読む

カテゴリー: cs.AI, cs.CL | Language Modeling with Editable External Knowledge はコメントを受け付けていません

YOLO-FEDER FusionNet: A Novel Deep Learning Architecture for Drone Detection

要約 画像ベースのドローン検出の主流の方法は、YOLOv5 のような汎用の物体検 … 続きを読む

カテゴリー: cs.AI, cs.CV | YOLO-FEDER FusionNet: A Novel Deep Learning Architecture for Drone Detection はコメントを受け付けていません

Evaluating Task-based Effectiveness of MLLMs on Charts

要約 このペーパーでは、GPT-4V はチャート上の低レベルのデータ分析タスクに … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Evaluating Task-based Effectiveness of MLLMs on Charts はコメントを受け付けていません

See It from My Perspective: Diagnosing the Western Cultural Bias of Large Vision-Language Models in Image Understanding

要約 ビジョン言語モデル (VLM) は、多くの言語の画像に関するクエリに応答で … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | See It from My Perspective: Diagnosing the Western Cultural Bias of Large Vision-Language Models in Image Understanding はコメントを受け付けていません

Deep Learning methodology for the identification of wood species using high-resolution macroscopic images

要約 持続可能な木材取引を支援するには、世界中で木材種の識別の分野で大幅な進歩が … 続きを読む

カテゴリー: cs.AI, cs.CV, I.2.1 | Deep Learning methodology for the identification of wood species using high-resolution macroscopic images はコメントを受け付けていません

Task Me Anything

要約 大規模なマルチモーダル言語モデル (MLM) のベンチマークは、特定の機能 … 続きを読む

カテゴリー: cs.AI, cs.CV | Task Me Anything はコメントを受け付けていません

A Brief Survey on Leveraging Large Scale Vision Models for Enhanced Robot Grasping

要約 ロボットによる把持は、現実世界のシナリオでは困難な運動タスクを提示しており … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | A Brief Survey on Leveraging Large Scale Vision Models for Enhanced Robot Grasping はコメントを受け付けていません