cs.AI」カテゴリーアーカイブ

Marvel: Accelerating Safe Online Reinforcement Learning with Finetuned Offline Policy

要約 広範な環境との相互作用に伴う高いコストとリスクにより、現在のオンラインで安 … 続きを読む

カテゴリー: cs.AI, cs.LG | Marvel: Accelerating Safe Online Reinforcement Learning with Finetuned Offline Policy はコメントを受け付けていません

A method to benchmark high-dimensional process drift detection

要約 プロセス曲線は、製造プロセスから得られる多変量有限時系列データです。 この … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | A method to benchmark high-dimensional process drift detection はコメントを受け付けていません

GeoPos: A Minimal Positional Encoding for Enhanced Fine-Grained Details in Image Synthesis Using Convolutional Neural Networks

要約 人間の手や指に存在するような複雑な幾何学的特徴を画像生成モデルが再現できな … 続きを読む

カテゴリー: 51, cs.AI, cs.CV, cs.LG, I.2.10 | GeoPos: A Minimal Positional Encoding for Enhanced Fine-Grained Details in Image Synthesis Using Convolutional Neural Networks はコメントを受け付けていません

Discriminative Fine-tuning of LVLMs

要約 CLIP のような対照的にトレーニングされた視覚言語モデル (VLM) は … 続きを読む

カテゴリー: cs.AI, cs.CV | Discriminative Fine-tuning of LVLMs はコメントを受け付けていません

EmbodiedOcc: Embodied 3D Occupancy Prediction for Vision-based Online Scene Understanding

要約 3D 占有予測は周囲のシーンの包括的な説明を提供し、3D 認識にとって不可 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | EmbodiedOcc: Embodied 3D Occupancy Prediction for Vision-based Online Scene Understanding はコメントを受け付けていません

Probabilistic Gaussian Superposition for Efficient 3D Occupancy Prediction

要約 3D セマンティック占有予測は、周囲のシーンのきめ細かいジオメトリとセマン … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Probabilistic Gaussian Superposition for Efficient 3D Occupancy Prediction はコメントを受け付けていません

FedDUAL: A Dual-Strategy with Adaptive Loss and Dynamic Aggregation for Mitigating Data Heterogeneity in Federated Learning

要約 Federated Learning (FL) は、さまざまなクライアント … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.DC, cs.LG | FedDUAL: A Dual-Strategy with Adaptive Loss and Dynamic Aggregation for Mitigating Data Heterogeneity in Federated Learning はコメントを受け付けていません

Negative Token Merging: Image-based Adversarial Feature Guidance

要約 否定的なプロンプトを使用したテキストベースの敵対的誘導は、拡散モデルを望ま … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG, stat.ML | Negative Token Merging: Image-based Adversarial Feature Guidance はコメントを受け付けていません

Florence-VL: Enhancing Vision-Language Models with Generative Vision Encoder and Depth-Breadth Fusion

要約 我々は、生成ビジョン基盤モデルである Florence-2 によって生成さ … 続きを読む

カテゴリー: cs.AI, cs.CV | Florence-VL: Enhancing Vision-Language Models with Generative Vision Encoder and Depth-Breadth Fusion はコメントを受け付けていません

Moto: Latent Motion Token as the Bridging Language for Robot Manipulation

要約 広範なコーパスで事前トレーニングされた大規模言語モデルの最近の開発では、最 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | Moto: Latent Motion Token as the Bridging Language for Robot Manipulation はコメントを受け付けていません