Baichuan2大模型，messages里传递了历史对话记录，但是回答跟历史记录不连贯，没有上下文的效果，问题解决！！！

因为baichuan2大模型的max_length最大是4096，如果你的max_new_tokens设置了4000，那么无论你传了多少历史对话记录，他都不能超过96个Token长度，这也就导致没有了上下文效果。跟踪过源码以后发现，用户输入的Token最大长度(max_input_tokens ),等于max_length - max_new_tokens,也就是说max_new_tokens越小

危险、

1142人浏览 · 2024-01-12 11:39:49

危险、 · 2024-01-12 11:39:49 发布

**选用大模型：Baichuan2-13B-Chat

问题解决：
max_new_tokens设置的过大
跟踪过源码以后发现，用户输入的Token最大长度(max_input_tokens ),等于max_length - max_new_tokens,也就是说max_new_tokens越小越好。

方案解析：
因为baichuan2大模型的max_length最大是4096，如果你的max_new_tokens设置了4000，那么无论你传了多少历史对话记录，他都不能超过96个Token长度，这也就导致没有了上下文效果。

拓展：

	作者还测试了chatglm3-6b-32k大模型，发现，在用户输入Token的最大长度上，刚好与百川相反，GLM
模型的max_length等于max_new_tokens+输入的tokens长度，所以max_new_tokens设置越大越好。
因为他之后会判断用户输入的tokens长度是否小于max_length，输入的tokens长度小于max_length时，就可以容纳更多的上下文

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

OpenLayers大数据可视化终极指南：10个性能优化技巧提升交互体验

OpenLayers作为一款功能强大的开源地图库，在处理大规模地理数据可视化时，性能优化是提升用户体验的关键。本文将分享10个实用的性能优化技巧，帮助开发者在使用OpenLayers构建大数据地图应用时，实现流畅的交互体验和高效的数据渲染。## 1. 合理使用WebGL渲染器提升大数据渲染速度 🚀WebGL渲染器是处理大规模地理数据的理想选择，它利用GPU加速图形渲染，能够显著提升数据量

魔乐社区

终极指南：如何用ffmpeg-python实现惊艳的视频合成效果

ffmpeg-python是一个强大的Python绑定库，为FFmpeg提供了简洁易用的接口，特别擅长处理复杂的视频过滤和合成任务。无论是简单的视频翻转还是复杂的多轨道合成，ffmpeg-python都能让你轻松实现专业级的视频效果。## 为什么选择ffmpeg-python进行视频合成？FFmpeg是视频处理领域的瑞士军刀，但命令行接口复杂且难以维护。ffmpeg-python将这种复杂