cs.AI」カテゴリーアーカイブ

Safe Explicable Planning

要約 人間の期待は、他者や世界を理解することから生まれます。 人間と AI の対 … 続きを読む

カテゴリー: cs.AI, cs.RO | Safe Explicable Planning はコメントを受け付けていません

Gecko: Versatile Text Embeddings Distilled from Large Language Models

要約 コンパクトで多用途なテキスト埋め込みモデルである Gecko を紹介します … 続きを読む

カテゴリー: cs.AI, cs.CL | Gecko: Versatile Text Embeddings Distilled from Large Language Models はコメントを受け付けていません

ReALM: Reference Resolution As Language Modeling

要約 参照解決は重要な問題であり、さまざまな種類のコンテキストを理解し、適切に処 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | ReALM: Reference Resolution As Language Modeling はコメントを受け付けていません

HARMamba: Efficient Wearable Sensor Human Activity Recognition Based on Bidirectional Selective SSM

要約 ウェアラブル センサーの人間活動認識 (HAR) は、活動センシングにおけ … 続きを読む

カテゴリー: cs.AI, cs.CV | HARMamba: Efficient Wearable Sensor Human Activity Recognition Based on Bidirectional Selective SSM はコメントを受け付けていません

Rapid Motor Adaptation for Robotic Manipulator Arms

要約 一般化可能な操作スキルを開発することは、身体化された AI における中心的 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Rapid Motor Adaptation for Robotic Manipulator Arms はコメントを受け付けていません

GlitchBench: Can large multimodal models detect video game glitches?

要約 大規模マルチモーダル モデル (LMM) は、視覚入力などの複数の入力モダ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | GlitchBench: Can large multimodal models detect video game glitches? はコメントを受け付けていません

SeaBird: Segmentation in Bird’s View with Dice Loss Improves Monocular 3D Detection of Large Objects

要約 単眼 3D 検出器は、自動車や小さな物体に対して優れたパフォーマンスを実現 … 続きを読む

カテゴリー: cs.AI, cs.CV | SeaBird: Segmentation in Bird’s View with Dice Loss Improves Monocular 3D Detection of Large Objects はコメントを受け付けていません

SERNet-Former: Semantic Segmentation by Efficient Residual Network with Attention-Boosting Gates and Attention-Fusion Networks

要約 セマンティック セグメンテーションにおける最先端の手法の効率を向上させるに … 続きを読む

カテゴリー: cs.AI, cs.CV | SERNet-Former: Semantic Segmentation by Efficient Residual Network with Attention-Boosting Gates and Attention-Fusion Networks はコメントを受け付けていません

MTLoRA: A Low-Rank Adaptation Approach for Efficient Multi-Task Learning

要約 大規模なデータセットで事前トレーニングされたモデルをさまざまな下流タスクに … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | MTLoRA: A Low-Rank Adaptation Approach for Efficient Multi-Task Learning はコメントを受け付けていません

Language Model Beats Diffusion — Tokenizer is Key to Visual Generation

要約 大規模言語モデル (LLM) は、言語の生成タスクでは主要なモデルですが、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | Language Model Beats Diffusion — Tokenizer is Key to Visual Generation はコメントを受け付けていません