-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
Hierarchical Modeling for Medical Visual Question Answering with Cross-Attention Fusion
要約 医療視覚的質問応答(MED-VQA)は、医療画像を使用して臨床的質問に答え … 続きを読む
GaussianAnything: Interactive Point Cloud Flow Matching For 3D Object Generation
要約 3Dコンテンツの生成は大幅に進歩していますが、既存の方法は、入力形式、潜在 … 続きを読む
Merging Embedded Topics with Optimal Transport for Online Topic Modeling on Data Streams
要約 トピックモデリングは、教師のない学習の重要なコンポーネントであり、テキスト … 続きを読む
PR-Attack: Coordinated Prompt-RAG Attacks on Retrieval-Augmented Generation in Large Language Models via Bilevel Optimization
要約 大規模な言語モデル(LLMS)は、幅広いアプリケーション、たとえば医学的質 … 続きを読む
Counting Hours, Counting Losses: The Toll of Unpredictable Work Schedules on Financial Security
要約 経済的不安定性は、今日の社会で重要な問題になっています。 研究は通常、財政 … 続きを読む
Dreamweaver: Learning Compositional World Models from Pixels
要約 人間は、世界の認識をオブジェクトと、色、形状、運動パターンなどの属性に分解 … 続きを読む
Benchmarking Multi-Organ Segmentation Tools for Multi-Parametric T1-weighted Abdominal MRI
要約 マルチパラメトリックMRI研究における複数の臓器のセグメンテーションは、イ … 続きを読む
SF2T: Self-supervised Fragment Finetuning of Video-LLMs for Fine-Grained Understanding
要約 ビデオベースの大規模な言語モデル(ビデオ-LLM)は、マルチモーダルLLM … 続きを読む
Information Gain Is Not All You Need
要約 モバイルロボット工学の自律的な探査は、環境を徹底的に観察するためのカバレッ … 続きを読む
NorEval: A Norwegian Language Understanding and Generation Evaluation Benchmark
要約 このペーパーでは、ノルウェーの生成言語モデル(LMS)の大規模な標準化され … 続きを読む