投稿者「jarxiv」のアーカイブ

VideoChat-A1: Thinking with Long Videos by Chain-of-Shot Reasoning

投稿日: 2025年6月9日作成者: jarxiv

要約最近のビデオ理解の進歩は、マルチモーダルの大手言語モデル（MLLMS）によ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

DermaCon-IN: A Multi-concept Annotated Dermatological Image Dataset of Indian Skin Disorders for Clinical AI Research

投稿日: 2025年6月9日作成者: jarxiv

要約人工知能は、スケーラブルな画像ベースの診断を可能にすることにより、皮膚療法 … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

WoundAIssist: A Patient-Centered Mobile App for AI-Assisted Wound Care With Physicians in the Loop

投稿日: 2025年6月9日作成者: jarxiv

要約特に老化した集団における慢性創傷の有病率の高まりは、延長された入院、コスト … 続きを読む →

カテゴリー: cs.CV, cs.HC | コメントを受け付けていません

Bidirectional Image-Event Guided Low-Light Image Enhancement

投稿日: 2025年6月9日作成者: jarxiv

要約極端な低光条件下では、動的範囲が限られているため、従来のフレームベースのカ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

CCLSTM: Coupled Convolutional Long-Short Term Memory Network for Occupancy Flow Forecasting

投稿日: 2025年6月9日作成者: jarxiv

要約動的エージェントの将来の状態を予測することは、自律運転の基本的なタスクです … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Gradient Similarity Surgery in Multi-Task Deep Learning

投稿日: 2025年6月9日作成者: jarxiv

要約マルチタスク学習（$ MTL $）パラダイムは、タスクで共有される高レベル … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

VisionTS: Visual Masked Autoencoders Are Free-Lunch Zero-Shot Time Series Forecasters

投稿日: 2025年6月9日作成者: jarxiv

要約基礎モデルは、時系列予測（TSF）で有望なアプローチとして浮上しています。 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

GenSpace: Benchmarking Spatially-Aware Image Generation

投稿日: 2025年6月9日作成者: jarxiv

要約人間は、写真のために3Dスペースでシーンを直感的に構成して配置できます。 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Balancing Beyond Discrete Categories: Continuous Demographic Labels for Fair Face Recognition

投稿日: 2025年6月9日作成者: jarxiv

要約バイアスは、顔認識モデルで一定のものでした。長年にわたり、研究者はモデル … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

CLaMR: Contextualized Late-Interaction for Multimodal Content Retrieval

投稿日: 2025年6月9日作成者: jarxiv

要約オンラインビデオWebコンテンツは豊富にマルチモーダルです。単一のビデオは … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.IR | コメントを受け付けていません

投稿者「jarxiv」のアーカイブ

VideoChat-A1: Thinking with Long Videos by Chain-of-Shot Reasoning

DermaCon-IN: A Multi-concept Annotated Dermatological Image Dataset of Indian Skin Disorders for Clinical AI Research

WoundAIssist: A Patient-Centered Mobile App for AI-Assisted Wound Care With Physicians in the Loop

Bidirectional Image-Event Guided Low-Light Image Enhancement

CCLSTM: Coupled Convolutional Long-Short Term Memory Network for Occupancy Flow Forecasting

Gradient Similarity Surgery in Multi-Task Deep Learning

VisionTS: Visual Masked Autoencoders Are Free-Lunch Zero-Shot Time Series Forecasters

GenSpace: Benchmarking Spatially-Aware Image Generation

Balancing Beyond Discrete Categories: Continuous Demographic Labels for Fair Face Recognition

CLaMR: Contextualized Late-Interaction for Multimodal Content Retrieval

最近の投稿

最近のコメント

アーカイブ

カテゴリー