cs.AI」カテゴリーアーカイブ

Adaptive Visual Imitation Learning for Robotic Assisted Feeding Across Varied Bowl Configurations and Food Types

要約 この研究では、ロボット支援給餌 (RAF) のための空間注意モジュールを備 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Adaptive Visual Imitation Learning for Robotic Assisted Feeding Across Varied Bowl Configurations and Food Types はコメントを受け付けていません

SynCDR : Training Cross Domain Retrieval Models with Synthetic Data

要約 クロスドメイン検索では、2 つの視覚ドメインにわたって同じ意味カテゴリから … 続きを読む

カテゴリー: cs.AI, cs.CV | SynCDR : Training Cross Domain Retrieval Models with Synthetic Data はコメントを受け付けていません

Vertical Federated Image Segmentation

要約 画像ベースの問題に対する AI ソリューションの普及に伴い、データのプライ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.DC, cs.LG, I.2.8 | Vertical Federated Image Segmentation はコメントを受け付けていません

Align before Adapt: Leveraging Entity-to-Region Alignments for Generalizable Video Action Recognition

要約 大規模な視覚言語の事前トレーニング済みモデルは、さまざまなビデオ タスクで … 続きを読む

カテゴリー: cs.AI, cs.CV | Align before Adapt: Leveraging Entity-to-Region Alignments for Generalizable Video Action Recognition はコメントを受け付けていません

Exploring Facial Expression Recognition through Semi-Supervised Pretraining and Temporal Modeling

要約 顔表情認識 (FER) は、コンピュータ ビジョンにおいて重要な役割を果た … 続きを読む

カテゴリー: cs.AI, cs.CV | Exploring Facial Expression Recognition through Semi-Supervised Pretraining and Temporal Modeling はコメントを受け付けていません

Just Shift It: Test-Time Prototype Shifting for Zero-Shot Generalization with Vision-Language Models

要約 ビジョン言語モデル (VLM) の進歩により、特にゼロショット学習設定にお … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Just Shift It: Test-Time Prototype Shifting for Zero-Shot Generalization with Vision-Language Models はコメントを受け付けていません

WHAC: World-grounded Humans and Cameras

要約 単眼ビデオからワールド座標系で正確なスケールで人間とカメラの軌跡を推定する … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG, cs.RO | WHAC: World-grounded Humans and Cameras はコメントを受け付けていません

TexTile: A Differentiable Metric for Texture Tileability

要約 我々は、繰り返しアーティファクトを導入することなくテクスチャ画像をそれ自体 … 続きを読む

カテゴリー: 68T07, 68U05, cs.AI, cs.CV, cs.GR, cs.LG, I.2.10 | TexTile: A Differentiable Metric for Texture Tileability はコメントを受け付けていません

SmartRefine: A Scenario-Adaptive Refinement Framework for Efficient Motion Prediction

要約 自動運転車 (AV) が動的で人間とロボットが混在する環境で安全に動作する … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | SmartRefine: A Scenario-Adaptive Refinement Framework for Efficient Motion Prediction はコメントを受け付けていません

Meta-Prompting for Automating Zero-shot Visual Recognition with LLMs

要約 大規模言語モデル (LLM) で生成されたカテゴリ固有のプロンプトのプロン … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Meta-Prompting for Automating Zero-shot Visual Recognition with LLMs はコメントを受け付けていません