使用大模型进行公式识别并且以LaTeX形式输出与OCR公式识别工具介绍
本文用来测试使用大模型与一些OCR工具来识别公式并将其转换成LaTeX形式的代码。旨在帮助在论文中需要编辑复杂公式的人快速高效处理公式内容。
·
本文用来测试使用大模型与一些OCR工具来识别公式并将其转换成LaTeX形式的代码。旨在帮助在论文中需要编辑复杂公式的人快速高效处理公式内容。
测试的大模型包括:
智谱清言:智谱清言
KimiChat:Kimi.ai - 帮你看更大的世界 (moonshot.cn)
讯飞星火:讯飞星火大模型-AI大语言模型-星火大模型-科大讯飞 (xfyun.cn)
通义千问:通义 (aliyun.com)
其他OCR工具:
Doc2X:Doc2X
latexocr 开源项目(需要Pytorch环境):LaTeX-OCR 识别数学公式,手写字符,转化为 LaTeX 代码; 写论文必备 数学公式轻松搞定!!
四组测试公式分别为:

TEST-1
智谱清言:

Kimichat:

通义:

讯飞星火:


Doc2X:

LaTeXOCR:

TEST-2
智谱清言:

Kimichat:

通义:

讯飞星火:


Doc2X:

LaTeXOCR:

TEST-3
智谱清言:

Kimichat:

通义:

讯飞星火:


Doc2X:

LaTeXOCR:

TEST-4
智谱清言:

Kimichat:

通义:

讯飞星火:


Doc2X:

LaTeXOCR:

总结:
大模型里面,通义应该是最好用,比较复杂的就不要用 KimiChat和智谱了
Doc2X很好用,LaTeXOCR那个要不是已经有pytorch环境的话感觉没啥必要装
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐



所有评论(0)