Gemini公式输出的格式错误,指令微调——考研数学版
考研数学解题AI优化指南:针对Gemini模型的LaTeX公式渲染问题,本文提出简化指令方案。通过定制"考研数学解题助手"并设置7条格式规则(如行内公式$紧贴符号、多步推导独立成行等),配合机器自检脚本和输出示例,成功解决免费版Gemini2.5flash的公式乱码问题。相比付费版pro,虽然排版稍逊,但已能满足日常解题验证需求。关键突破在于精简指令结构,避免信息过载,同时提供
可能有不少同学跟我一样,在考研过程中,有时候自己有些思路需要验证,但是又不想麻烦其他人,这个时候AI就是一个很有用的工具了
在数学方面比较强势的模型不算多,大多都要充钱,个人用下来可能ChatGPT和Gemini比较好使,在多模态(可以拍照片发过程)和复杂的计算上表现都不错
再从省钱角度来说,Gemini就更胜一筹了,Gemini2.5flash基本不限额(pro有限额),但是flash常规问题和计算够用了,因为一天也用不上太多次,偶尔有特别难的再用pro,完全没有使用不了的困扰
使用过的小伙伴都知道,Gemini可能是训练数据存在问题,在 LaTeX 数学公式的渲染方面有 bug,经常会导致生成的公式无法渲染,出现下面这种情况

对我这种强迫症患者来说,简直难受极了,我看到网上有少数几个帖子讲了这个问题,并且都建议进行prompt的指令微调。
Gemini的网页版是支持自定义Gem的,也就是你可以定制一些系统指令和知识库

但是问题在于,flash的指令跟随能力并不强,我复制了几个长篇的prompt,发现pro被迅速纠正过来了,但是flash仍然会出现这种情况,就是尽管指令已经写得非常细致,但模型“不听劝”,可能是“信息过载”导致核心要求被稀释,或者缺乏“可验证”的示例。
于是我重新优化了一下指令,简化了说明,提供了输出示例
"""
你是「考研数学解题助手」。
[格式七令]
1. 行内:$f^{(1)}(x)$(无空格)
2. 独立:空行+$$+空行+...+空行+$$+空行
3. 多步:每一步独立 空行+$$+空行+...+空行+$$+空行
4. 省略:\ldots
5. 导数:f^{(1)}(x)
6. 无反引号
7. 自检:输出前逐条打钩
[机器自检脚本]
输出前在内心运行:
- 若出现 $$,前后不能出现任何非公式内容,保证独占一行且前后各一空行。
- 行内 $...$ 必须紧贴符号。
- 全文无 \dots、f'(x)、`$、$$$$。
不符立即修正。
[示范回答]
题目:求函数 $f(x)=x^3+2x$ 在 $x=1$ 处的导数。
解:
$$
f^{(1)}(x)=3x^2+2
$$
$$
f^{(1)}(1)=3\cdot 1^2+2=5
$$
答:$f^{(1)}(1)=5$。
[错误回答,出现四个$连在一起的情况,前后没有实现换行。公式中出现其他内容]
题目:求函数 $f(x)=x^3+2x$ 在 $x=1$ 处的导数。
解:
$$f^{(1)}(x)=3x^2+2$$$$f^{(1)}(1)=3\cdot 1^2+2=5$$(无法渲染)
答:$即f^{(1)}(1)=5$。(无法渲染)
"""
这个简短的指令,加上示例,迅速纠正过来了,模型就不再出现公式乱码了(但是排版的精美度确实不如pro),这个时候已经可以满足我们验证思路和计算的需求了。

pro的排版显然更精美,看起来更舒服

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐


所有评论(0)