无论是如今爆火的LLMs(Large Language Models)技术,还是传统的NLP技术,分词环节都是至关重要的一步。为了更好地了解中文自然语言处理的关键环节,今天我想和大家分享分词技术—基于词图的机械分词法。

本文主要围绕中文分词为主进行讲解,我会从分词定义及原因,分词的应用场景,分词的难点,什么是语言模型,马尔科夫假设,基于词图的分词方法这几个方面来书写这篇文章。

完整文章: 点击查看原文

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐