cs.AI」カテゴリーアーカイブ

PIR: Remote Sensing Image-Text Retrieval with Prior Instruction Representation Learning

要約 リモート センシングによる画像とテキストの検索は、リモート センシングによ … 続きを読む

カテゴリー: cs.AI, cs.CV | PIR: Remote Sensing Image-Text Retrieval with Prior Instruction Representation Learning はコメントを受け付けていません

Two-Phase Dynamics of Interactions Explains the Starting Point of a DNN Learning Over-Fitted Features

要約 この論文では、ディープ ニューラル ネットワーク (DNN) 学習相互作用 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Two-Phase Dynamics of Interactions Explains the Starting Point of a DNN Learning Over-Fitted Features はコメントを受け付けていません

Faces that Speak: Jointly Synthesising Talking Face and Speech from Text

要約 この作業の目標は、自然な話し顔とテキストからの音声出力を同時に生成すること … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.SD, eess.AS, eess.IV | Faces that Speak: Jointly Synthesising Talking Face and Speech from Text はコメントを受け付けていません

FFF: Fixing Flawed Foundations in contrastive pre-training results in very strong Vision-Language models

要約 ノイズとキャプションの品質は視覚言語対比事前トレーニングに影響を与える重要 … 続きを読む

カテゴリー: cs.AI, cs.CV | FFF: Fixing Flawed Foundations in contrastive pre-training results in very strong Vision-Language models はコメントを受け付けていません

Fine-Tuning Large Vision-Language Models as Decision-Making Agents via Reinforcement Learning

要約 特殊な視覚指示に従うデータに基づいて微調整された大規模なビジョン言語モデル … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Fine-Tuning Large Vision-Language Models as Decision-Making Agents via Reinforcement Learning はコメントを受け付けていません

4D Panoptic Scene Graph Generation

要約 私たちは 3 次元空間に生きながら、時間という 4 次元を進んでいます。 … 続きを読む

カテゴリー: cs.AI, cs.CV | 4D Panoptic Scene Graph Generation はコメントを受け付けていません

Learning Reward for Robot Skills Using Large Language Models via Self-Alignment

要約 ロボットに幅広いスキルのレパートリーを持たせるには、報酬関数の学習が依然と … 続きを読む

カテゴリー: cs.AI, cs.RO | Learning Reward for Robot Skills Using Large Language Models via Self-Alignment はコメントを受け付けていません

CoFiI2P: Coarse-to-Fine Correspondences for Image-to-Point Cloud Registration

要約 画像からポイント クラウド (I2P) への登録は、ロボットや自動運転車が … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | CoFiI2P: Coarse-to-Fine Correspondences for Image-to-Point Cloud Registration はコメントを受け付けていません

Perception Without Vision for Trajectory Prediction: Ego Vehicle Dynamics as Scene Representation for Efficient Active Learning in Autonomous Driving

要約 この研究では、自動運転機械学習タスクにおける効率的なデータキュレーションの … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Perception Without Vision for Trajectory Prediction: Ego Vehicle Dynamics as Scene Representation for Efficient Active Learning in Autonomous Driving はコメントを受け付けていません

Explainable AI for Ship Collision Avoidance: Decoding Decision-Making Processes and Behavioral Intentions

要約 この研究では、船舶の衝突回避のための説明可能な AI を開発しました。 当 … 続きを読む

カテゴリー: cs.AI, cs.RO, cs.SY, eess.SY | Explainable AI for Ship Collision Avoidance: Decoding Decision-Making Processes and Behavioral Intentions はコメントを受け付けていません