今日 09:56
內地「國產大模型六小虎」之一的人工智能(AI)初創公司智譜(02513)正式發布並開源GLM-OCR。
智譜表示,該模型僅0.9B參數規模,支持vLLM、SGLang和Ollama部署。在文本、公式、表格識別及訊息抽取四大細分領域的表現優於多款OCR專項模型,性能接近谷歌(Google)旗艦大模型Gemini 3 Pro。在實際應用中,GLM-OCR能夠精準解析掃描件、PDF、表格及票據,有效解決手寫、印章、豎排及多語言混排難題。
該公司稱,未來將持續迭代GLM-OCR,推出更多尺寸版本,並將能力延伸至更多語言和視頻OCR,全面拓寬視覺智能的應用邊界。