我们这一次招募的岗位是通用复杂指令专家——你将与我们一起设计高约束、多目标、贴近真实场景的复杂指令,并对阿里(市面上)主流大模型输出做结构化评估。

如果你:

1、来自985、211、双一流高校或海外QS前200高校;

2、高频使用 GPT、Claude 、Qwen等主流模型,能借助大模型在日常学习、工作、科研中解决常态化的问题;

3、熟悉提示工程技巧(few-shot、思维链、对抗性提示、角色控制等),能设计多约束、高复杂的自然语言指令,并产出高质量参考回复;

4、玩过 Agent 开发,尤其在扣子平台搭过 3 个以上智能体。

如果你符合以上画像,那么你就是我们要找的人!当然我们给出了400/条的诚意。

需要你:

1、基于真实工作/科研/决策场景,原创设计具体、客观、多约束的文本指令(例如:“基于以下三份财报摘要,对比两家公司的现金流健康度,并以投行分析师口吻给出投资建议,不超过300字”),为每条指令提供高质量参考回复;

2、使用自建评分维度,对至少两个主流大模型的输出进行打分并撰写可解释的评估理由;

3、每日提交 5–10 条,严禁使用模型生成或合成指令。

这不是简单写 prompt,而是深度参与大模型能力对齐与优化的关键环节。欢迎真正懂模型、会用模型的你加入!

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐