「cs.AI」カテゴリーアーカイブ

Real-World Robot Applications of Foundation Models: A Review

投稿日: 2024年2月9日作成者: jarxiv

要約大規模言語モデル (LLM) やビジョン言語モデル (VLM) などの基礎 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Jacquard V2: Refining Datasets using the Human In the Loop Data Correction Method

投稿日: 2024年2月9日作成者: jarxiv

要約産業オートメーションの急速な進歩の中で、視覚ベースのロボットによる把握はま … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

InkSight: Offline-to-Online Handwriting Conversion by Learning to Read and Write

投稿日: 2024年2月9日作成者: jarxiv

要約デジタルメモの作成は人気が高まっており、デジタルインクと呼ばれるベクト … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

You Only Need One Color Space: An Efficient Network for Low-light Image Enhancement

投稿日: 2024年2月9日作成者: jarxiv

要約低光量画像強化 (LLIE) タスクは、破損した低光量画像から詳細と視覚情 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

FusionSF: Fuse Heterogeneous Modalities in a Vector Quantized Framework for Robust Solar Power Forecasting

投稿日: 2024年2月9日作成者: jarxiv

要約太陽光発電所を電力網に統合し、計画を立てて電力網の安全性を確保するには、正 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

How to train your VAE

投稿日: 2024年2月9日作成者: jarxiv

要約変分オートエンコーダ (VAE) は、機械学習における生成モデリングと表現 … 続きを読む →

カテゴリー: 68T07, cs.AI, cs.CV, cs.LG, I.2.4 | コメントを受け付けていません

CREMA: Multimodal Compositional Video Reasoning via Efficient Modular Adaptation and Fusion

投稿日: 2024年2月9日作成者: jarxiv

要約マルチモーダル構成推論アプローチは目覚ましい進歩を遂げていますが、多くのモ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

ClickSAM: Fine-tuning Segment Anything Model using click prompts for ultrasound image segmentation

投稿日: 2024年2月9日作成者: jarxiv

要約新しくリリースされた Segment Anything Model (SA … 続きを読む →

カテゴリー: cs.AI, cs.CV, physics.med-ph | コメントを受け付けていません

SPHINX-X: Scaling Data and Parameters for a Family of Multi-modal Large Language Models

投稿日: 2024年2月9日作成者: jarxiv

要約私たちは、SPHINX をベースに開発された広範なマルチモダリティ大規模言 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

How Far Can Fairness Constraints Help Recover From Biased Data?

投稿日: 2024年2月9日作成者: jarxiv

要約公平な分類に対する一般的な考えは、公平性の制約により精度とのトレードオフが … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

Real-World Robot Applications of Foundation Models: A Review

Jacquard V2: Refining Datasets using the Human In the Loop Data Correction Method

InkSight: Offline-to-Online Handwriting Conversion by Learning to Read and Write

You Only Need One Color Space: An Efficient Network for Low-light Image Enhancement

FusionSF: Fuse Heterogeneous Modalities in a Vector Quantized Framework for Robust Solar Power Forecasting

How to train your VAE

CREMA: Multimodal Compositional Video Reasoning via Efficient Modular Adaptation and Fusion

ClickSAM: Fine-tuning Segment Anything Model using click prompts for ultrasound image segmentation

SPHINX-X: Scaling Data and Parameters for a Family of Multi-modal Large Language Models

How Far Can Fairness Constraints Help Recover From Biased Data?

最近の投稿

最近のコメント

アーカイブ

カテゴリー