本文用来测试使用大模型与一些OCR工具来识别公式并将其转换成LaTeX形式的代码。旨在帮助在论文中需要编辑复杂公式的人快速高效处理公式内容。


测试的大模型包括:

智谱清言:智谱清言

KimiChat:Kimi.ai - 帮你看更大的世界 (moonshot.cn)

讯飞星火:讯飞星火大模型-AI大语言模型-星火大模型-科大讯飞 (xfyun.cn)

通义千问:通义 (aliyun.com)

其他OCR工具:

Doc2X:Doc2X

latexocr 开源项目(需要Pytorch环境):LaTeX-OCR 识别数学公式,手写字符,转化为 LaTeX 代码; 写论文必备 数学公式轻松搞定!!

四组测试公式分别为:

 

 

 

 TEST-1

智谱清言:

Kimichat:

通义:

讯飞星火:

Doc2X:

LaTeXOCR:

 TEST-2

智谱清言:

Kimichat:

通义:

讯飞星火:

Doc2X:

LaTeXOCR:

 TEST-3

智谱清言:

Kimichat:

通义:

讯飞星火:

Doc2X:

LaTeXOCR:

 TEST-4

智谱清言:

Kimichat:

通义:

讯飞星火:

Doc2X:

LaTeXOCR: 

总结:

大模型里面,通义应该是最好用,比较复杂的就不要用 KimiChat和智谱了

Doc2X很好用,LaTeXOCR那个要不是已经有pytorch环境的话感觉没啥必要装

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐