cs.LG」カテゴリーアーカイブ

LokiTalk: Learning Fine-Grained and Generalizable Correspondences to Enhance NeRF-based Talking Head Synthesis

要約 Neural Radiance Fields (NeRF) の導入以来、ト … 続きを読む

カテゴリー: cs.CV, cs.LG | LokiTalk: Learning Fine-Grained and Generalizable Correspondences to Enhance NeRF-based Talking Head Synthesis はコメントを受け付けていません

MRANet: A Modified Residual Attention Networks for Lung and Colon Cancer Classification

要約 肺がんと結腸がんはがんによる死亡率の主な原因です。 効果的な治療には、早期 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | MRANet: A Modified Residual Attention Networks for Lung and Colon Cancer Classification はコメントを受け付けていません

Causal Deep Learning

要約 私たちは、因果的ディープ ニューラル ネットワークのセットを導出します。そ … 続きを読む

カテゴリー: cs.CV, cs.LG, I.2.10 | Causal Deep Learning はコメントを受け付けていません

VidTwin: Video VAE with Decoupled Structure and Dynamics

要約 ビデオ オートエンコーダ (ビデオ AE) の最近の進歩により、ビデオ生成 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | VidTwin: Video VAE with Decoupled Structure and Dynamics はコメントを受け付けていません

DiffH2O: Diffusion-Based Synthesis of Hand-Object Interactions from Textual Descriptions

要約 3D で自然な手とオブジェクトのインタラクションを生成することは、結果とし … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG | DiffH2O: Diffusion-Based Synthesis of Hand-Object Interactions from Textual Descriptions はコメントを受け付けていません

Survey of Large Multimodal Model Datasets, Application Categories and Taxonomy

要約 人工知能の急速に進化している分野であるマルチモーダル学習は、テキスト、画像 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Survey of Large Multimodal Model Datasets, Application Categories and Taxonomy はコメントを受け付けていません

AdaCred: Adaptive Causal Decision Transformers with Feature Crediting

要約 強化学習 (RL) はシーケンス モデリング問題として定式化でき、モデルは … 続きを読む

カテゴリー: cs.LG, cs.RO | AdaCred: Adaptive Causal Decision Transformers with Feature Crediting はコメントを受け付けていません

TalkWithMachines: Enhancing Human-Robot Interaction for Interpretable Industrial Robotics Through Large/Vision Language Models

要約 TalkWithMachines は、特に安全性が重要なアプリケーション向 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.HC, cs.LG, cs.RO | TalkWithMachines: Enhancing Human-Robot Interaction for Interpretable Industrial Robotics Through Large/Vision Language Models はコメントを受け付けていません

Toward Appearance-based Autonomous Landing Site Identification for Multirotor Drones in Unstructured Environments

要約 マルチロータードローン飛行における残りの課題は、構造化されていない環境で実 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Toward Appearance-based Autonomous Landing Site Identification for Multirotor Drones in Unstructured Environments はコメントを受け付けていません

System Safety Monitoring of Learned Components Using Temporal Metric Forecasting

要約 学習可能な自律システムでは、システムの動作コンテキストを考慮して、その出力 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO, cs.SE | System Safety Monitoring of Learned Components Using Temporal Metric Forecasting はコメントを受け付けていません