月別アーカイブ: 2025年3月

MaTVLM: Hybrid Mamba-Transformer for Efficient Vision-Language Modeling

要約 線形の複雑さを伴うRNNモデルの進歩により、変圧器の二次複雑さの課題は克服 … 続きを読む

カテゴリー: cs.CV | MaTVLM: Hybrid Mamba-Transformer for Efficient Vision-Language Modeling はコメントを受け付けていません

TSCMamba: Mamba Meets Multi-View Learning for Time Series Classification

要約 多変量時系列分類(TSC)は、ヘルスケアやファイナンスなどの分野のさまざま … 続きを読む

カテゴリー: cs.LG | TSCMamba: Mamba Meets Multi-View Learning for Time Series Classification はコメントを受け付けていません

Population Transformer: Learning Population-level Representations of Neural Activity

要約 大規模な神経記録の任意のアンサンブルの人口レベルのコードを学習する自己監督 … 続きを読む

カテゴリー: cs.LG, q-bio.NC | Population Transformer: Learning Population-level Representations of Neural Activity はコメントを受け付けていません

Valley: Video Assistant with Large Language model Enhanced abilitY

要約 大規模な言語モデル(LLMS)は、驚くべき会話能力を備えた、視覚的およびテ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Valley: Video Assistant with Large Language model Enhanced abilitY はコメントを受け付けていません

Leveraging Large Language Models for Collective Decision-Making

要約 会議のスケジューリング、コラボレーション、プロジェクト計画などのさまざまな … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.HC, cs.SI | Leveraging Large Language Models for Collective Decision-Making はコメントを受け付けていません

A Survey of State of the Art Large Vision Language Models: Alignment, Benchmark, Evaluations and Challenges

要約 マルチモーダルビジョン言語モデル(VLM)は、コンピュータービジョンと自然 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | A Survey of State of the Art Large Vision Language Models: Alignment, Benchmark, Evaluations and Challenges はコメントを受け付けていません

Uni-Gaussians: Unifying Camera and Lidar Simulation with Gaussians for Dynamic Driving Scenarios

要約 自動運転車の安全性を確保するには、さまざまな動的な駆動シナリオにわたって、 … 続きを読む

カテゴリー: cs.NI, cs.RO | Uni-Gaussians: Unifying Camera and Lidar Simulation with Gaussians for Dynamic Driving Scenarios はコメントを受け付けていません

MAP: Multi-user Personalization with Collaborative LLM-powered Agents

要約 マルチユーザー設定における大規模な言語モデル(LLMS)およびLLM駆動エ … 続きを読む

カテゴリー: cs.AI, cs.HC, cs.RO, I.2.1 | MAP: Multi-user Personalization with Collaborative LLM-powered Agents はコメントを受け付けていません

Dynamic-Dark SLAM: RGB-Thermal Cooperative Robot Vision Strategy for Multi-Person Tracking in Both Well-Lit and Low-Light Scenes

要約 ロボットビジョンでは、サーマルカメラは、完全な暗闇の中でも人間を認識する重 … 続きを読む

カテゴリー: cs.CV, cs.RO | Dynamic-Dark SLAM: RGB-Thermal Cooperative Robot Vision Strategy for Multi-Person Tracking in Both Well-Lit and Low-Light Scenes はコメントを受け付けていません

NuPlanQA: A Large-Scale Dataset and Benchmark for Multi-View Driving Scene Understanding in Multi-Modal Large Language Models

要約 マルチモーダルの大手言語モデル(MLLM)の最近の進歩は、さまざまなドメイ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | NuPlanQA: A Large-Scale Dataset and Benchmark for Multi-View Driving Scene Understanding in Multi-Modal Large Language Models はコメントを受け付けていません