cavium CN71XX芯片包处理过程总结

Tasdily

1689人浏览 · 2019-08-31 14:53:53

Tasdily · 2019-08-31 14:53:53 发布

1、一般包收发过程：一般情况下，网卡收到数据包后通过DMA映射到指定的内存位置，然后中断通知CPU来取数据包，经过几次内存拷贝后到达协议栈。为了加速包的处理效率，一些CPU采用各种协处理器来帮助完成包的处理。
2、Cavium的OCTEON为网络做了大量优化，主要包括数量众多的协处理器，不同的协处理器完成特定的任务，大大简化了软件的复杂度提高了性能，并且能够从硬件上保证一些特性比如包保序。
3、FPA：Free Pool Alloctor主要负责分配收发包过程中的packet work entry以及packet的data buffer和PKO command buffer。
4、对FPA的操作主要有三种：
对FPA的操作主要有三种：
buffer_allocte(synchronous): core会等待可用的buffer返回或者是返回的NULL
buffer_allocte(asynchronous): core不会等待buffer地址返回，而是在之后的时间里会从特定位置接受到buffer地址
buffer_free(synchronous): 这个操作会把buffer地址返还到特定的FPA pool
5、主要使用了FPA 0 1 2，0负责在收到packet后存储packet buffer data部分，1负责对packet header部分进行简单hash后的信息存储，2是pko command buffers。在banfflite的一个BUG中人为的在FPA0中分配packet buffer的时候会出现crash的现象，Cavium的人就此给出一个workaround就是建议在FPA4中分配packet buffer去发送这个包，但是OCTEON在硬件上规定收包必须用FPA0.因此packet buffer的大小就是2176。
6、PIP/IPD
这个协处理器的主要作用就是从interface上比如：SGMII XAUI口上收到数据后由PIP对数据包的头部进行5-tuple的计算后得到这个包的WQE(Work Queue Entry)和group tag Qos类提交给SSO所需要的数据，而IPD则是将收到的数据包的数据部分copy到data FPA中申请的fpa buffer中去。这个协处理器提供收包以及包的最简单的CRC 错误检查以及丢弃操作，OCTEON也提供另外一种收包方法，在不用PIP/IPD的时候可以使用内核的NAPI的方式使用cnMIPS core的poll方式来进行收包。

检查packet，包括L2/L3头部的错误
提供拥塞控制，可在PIP部分丢掉部分包
创建WQE(Work Queue Entry)
决定提供给SSO的WQE的包属性(Group Qos Tag-Type Tage-Value)
把收到的包存储在PIP/IPD内部的buffer和RAM中
发送WQE到SSO完成调度
一般配置流程：

一个core调用： cvmx_helper_initialize_packet_io_global()
每个core都调用： cvmx_helper_initialize_packet_io_local()
使用cvmx_pip*和cvmx_ipd*来配置PIP/IPD
使用：cvmx_helper_ipd_and_packet_input_enable()打开收包功能

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

小参数・大码力・易部署 | Qwen3.6-27B上线魔乐社区，基于昇腾的部署教程来了

继一周前模型开源发布后，千问再度开源Qwen3.6-27B —— 一个拥有270亿参数的稠密多模态模型，也是社区呼声最高的模型规格。Qwen3.6-27B 依然支持多模态思考与非思考模式，在智能体编程方面达到了旗舰级表现，全面超越前代开源旗舰 Qwen3.5-397B-A17B（总参数397B / 激活参数17B的MoE模型）。作为稠密架构，它无需MoE路由即可部署，是开发者在实用、可广泛部署规模