贴一下汇总贴:论文阅读记录

论文链接:《Small-text: Active Learning for Text Classification in Python》

一、摘要

我们提出了 small-text,这是一个简单的模块化主动学习库,它为 Python 中的文本分类提供基于池的主动学习。它带有各种预先实现的最先进的查询策略,包括一些可以利用 GPU 的策略。明确定义的接口允许将多种此类查询策略与不同的分类器相结合,从而促进快速混合和匹配,并使主动学习实验和应用程序的快速开发成为可能。为了以一致的方式访问各种分类器,它集成了几个著名的机器学习库,即 scikit-learn、PyTorch 和 Huggingface 转换器——后者的集成可作为可选的可安装扩展。该库可在此:GitHub

二、结论

我们引入了small-text,一个模块化的Python库,它为文本分类提供了主动学习。它集成了现有的库,如scikit-learn、PyTorch和transformers,这使得Python生态系统可以轻松访问最先进的主动学习。由于遵循软件工程最佳实践,它提供了一组强大的组件,可以在实验和应用中快速应用主动学习进行文本分类。

三、model

模型框架:
在这里插入图片描述

主动学习旨在最小化所需的标记数据量,同时最大化最终模型的性能,例如文本分类的准确性。

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐