投稿者「jarxiv」のアーカイブ

VideoChat-A1: Thinking with Long Videos by Chain-of-Shot Reasoning

要約 最近のビデオ理解の進歩は、マルチモーダルの大手言語モデル(MLLMS)によ … 続きを読む

カテゴリー: cs.CV | VideoChat-A1: Thinking with Long Videos by Chain-of-Shot Reasoning はコメントを受け付けていません

DermaCon-IN: A Multi-concept Annotated Dermatological Image Dataset of Indian Skin Disorders for Clinical AI Research

要約 人工知能は、スケーラブルな画像ベースの診断を可能にすることにより、皮膚療法 … 続きを読む

カテゴリー: cs.CV, eess.IV | DermaCon-IN: A Multi-concept Annotated Dermatological Image Dataset of Indian Skin Disorders for Clinical AI Research はコメントを受け付けていません

WoundAIssist: A Patient-Centered Mobile App for AI-Assisted Wound Care With Physicians in the Loop

要約 特に老化した集団における慢性創傷の有病率の高まりは、延長された入院、コスト … 続きを読む

カテゴリー: cs.CV, cs.HC | WoundAIssist: A Patient-Centered Mobile App for AI-Assisted Wound Care With Physicians in the Loop はコメントを受け付けていません

Bidirectional Image-Event Guided Low-Light Image Enhancement

要約 極端な低光条件下では、動的範囲が限られているため、従来のフレームベースのカ … 続きを読む

カテゴリー: cs.CV | Bidirectional Image-Event Guided Low-Light Image Enhancement はコメントを受け付けていません

CCLSTM: Coupled Convolutional Long-Short Term Memory Network for Occupancy Flow Forecasting

要約 動的エージェントの将来の状態を予測することは、自律運転の基本的なタスクです … 続きを読む

カテゴリー: cs.CV | CCLSTM: Coupled Convolutional Long-Short Term Memory Network for Occupancy Flow Forecasting はコメントを受け付けていません

Gradient Similarity Surgery in Multi-Task Deep Learning

要約 マルチタスク学習($ MTL $)パラダイムは、タスクで共有される高レベル … 続きを読む

カテゴリー: cs.CV, cs.LG | Gradient Similarity Surgery in Multi-Task Deep Learning はコメントを受け付けていません

VisionTS: Visual Masked Autoencoders Are Free-Lunch Zero-Shot Time Series Forecasters

要約 基礎モデルは、時系列予測(TSF)で有望なアプローチとして浮上しています。 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | VisionTS: Visual Masked Autoencoders Are Free-Lunch Zero-Shot Time Series Forecasters はコメントを受け付けていません

GenSpace: Benchmarking Spatially-Aware Image Generation

要約 人間は、写真のために3Dスペースでシーンを直感的に構成して配置できます。 … 続きを読む

カテゴリー: cs.CV | GenSpace: Benchmarking Spatially-Aware Image Generation はコメントを受け付けていません

Balancing Beyond Discrete Categories: Continuous Demographic Labels for Fair Face Recognition

要約 バイアスは、顔認識モデルで一定のものでした。 長年にわたり、研究者はモデル … 続きを読む

カテゴリー: cs.CV | Balancing Beyond Discrete Categories: Continuous Demographic Labels for Fair Face Recognition はコメントを受け付けていません

CLaMR: Contextualized Late-Interaction for Multimodal Content Retrieval

要約 オンラインビデオWebコンテンツは豊富にマルチモーダルです。単一のビデオは … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.IR | CLaMR: Contextualized Late-Interaction for Multimodal Content Retrieval はコメントを受け付けていません