cs.AI」カテゴリーアーカイブ

End-To-End Underwater Video Enhancement: Dataset and Model

要約 水中ビデオ強化 (UVE) は、水中ビデオの視認性とフレーム品質を向上させ … 続きを読む

カテゴリー: cs.AI, cs.CV | End-To-End Underwater Video Enhancement: Dataset and Model はコメントを受け付けていません

LeTO: Learning Constrained Visuomotor Policy with Differentiable Trajectory Optimization

要約 この論文では、微分可能軌道最適化を介して制約付き視覚運動ポリシーを学習する … 続きを読む

カテゴリー: cs.AI, cs.RO | LeTO: Learning Constrained Visuomotor Policy with Differentiable Trajectory Optimization はコメントを受け付けていません

Effectiveness Assessment of Recent Large Vision-Language Models

要約 大規模ビジョン言語モデル (LVLM) の出現は、汎用人工知能の追求に向け … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Effectiveness Assessment of Recent Large Vision-Language Models はコメントを受け付けていません

OCR is All you need: Importing Multi-Modality into Image-based Defect Detection System

要約 自動光学検査 (AOI) は製造プロセスにおいて極めて重要な役割を果たして … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | OCR is All you need: Importing Multi-Modality into Image-based Defect Detection System はコメントを受け付けていません

Global $\mathcal{L}^2$ minimization at uniform exponential rate via geometrically adapted gradient descent in Deep Learning

要約 深層学習ネットワークで $\mathcal{L}^2$ コスト関数の最小化 … 続きを読む

カテゴリー: 57R70, 62M45, cs.AI, cs.LG, math-ph, math.MP, math.OC, stat.ML | Global $\mathcal{L}^2$ minimization at uniform exponential rate via geometrically adapted gradient descent in Deep Learning はコメントを受け付けていません

Quiet-STaR: Language Models Can Teach Themselves to Think Before Speaking

要約 書いたり話したりするとき、人は時々立ち止まって考えることがあります。 推論 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Quiet-STaR: Language Models Can Teach Themselves to Think Before Speaking はコメントを受け付けていません

LLM^3:Large Language Model-based Task and Motion Planning with Motion Failure Reasoning

要約 従来のタスクおよびモーション プランニング (TAMP) アプローチは、シ … 続きを読む

カテゴリー: cs.AI, cs.RO | LLM^3:Large Language Model-based Task and Motion Planning with Motion Failure Reasoning はコメントを受け付けていません

Reinforcement Learning with Token-level Feedback for Controllable Text Generation

要約 実際のアプリケーションの要件を満たすには、大規模言語モデル (LLM) の … 続きを読む

カテゴリー: cs.AI, cs.CL | Reinforcement Learning with Token-level Feedback for Controllable Text Generation はコメントを受け付けていません

UniRepLKNet: A Universal Perception Large-Kernel ConvNet for Audio, Video, Point Cloud, Time-Series and Image Recognition

要約 ラージカーネル畳み込みニューラル ネットワーク (ConvNets) は最 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | UniRepLKNet: A Universal Perception Large-Kernel ConvNet for Audio, Video, Point Cloud, Time-Series and Image Recognition はコメントを受け付けていません

ProMISe: Promptable Medical Image Segmentation using SAM

要約 Segment Anything Model (SAM) の提案により、医 … 続きを読む

カテゴリー: cs.AI, cs.CV | ProMISe: Promptable Medical Image Segmentation using SAM はコメントを受け付けていません