New benchmark PuMVR reveals script bias in multilingual VLMs

AnalysisAI Models

23 hours ago

New benchmark PuMVR reveals script bias in multilingual VLMs

PuMVR (Punjabi Multimodal Visual Reasoning) tests VLMs on Punjabi text in Gurmukhi and Shahmukhi scripts, revealing significant accuracy drops across scripts for the same language. The benchmark challenges the one-to-one language-script mapping assumption in multilingual VLM evaluation.

Not Truly Multilingual: Script Consistency as a Missing Dimension in VLM Evaluation6 days agoPrabhjot Singh, Bhushan Pawar, Madhu Reddiboina, Rajvee Sheth

23 hours ago