ECC算法详解及硬件实现

2022-05-05 来源：好走旅游网

ECC算法详解及硬件实现 ECC 的全称是 Error Checking and Correction，是一种用于 Nand 的差错检测和修正算法。如果操作时序和电路稳定性不存在问题的话， NAND Flash 出错的时候一般不会造成整个 Block 或是 Page 不能读取或是全部出错，而是整个 Page（例如 512Bytes）中只有一个或几个 bit 出错。ECC 能纠正 1 个比特错误和检测 2 个比特错误，而且计算速度很快，但对 1 比特以上的错误无法纠正，对 2 比特以上的错误不保证能检测。校验码生成算法：ECC 校验每次对 256 字节的数据进行操作，包含列校验和行校验。对每个待校验的 Bit 位求异或，若结果为 0，则表明含有偶数个 1；若结果为 1，则表明含有奇数个 1。列校验规则如表 1 所示。256 字节数据形成 256 行、8 列的矩阵，矩阵每个元素表示一个 Bit 位。其中 CP0 ~ CP5 为六个 Bit 位，表示 Column Parity（列极性）， CP0 为第 0、2、4、6 列的极性，CP1 为第 1、3、5、7 列的极性， CP2 为第 0、1、4、5 列的极性，CP3 为第 2、3、6、7 列的极性， CP4 为第 0、1、2、3 列的极性，CP5 为第 4、5、6、7 列的极性。用公式表示就是： CP0=Bit0^Bit2^Bit4^Bit6，表示第 0 列内部 256 个 Bit 位异或之后再跟第 2 列 256 个 Bit 位异或，再跟第 4 列、第 6 列的每个 Bit 位异或，这样，CP0 其实是 256*4=1024 个 Bit 位异或的结果。CP1 ~ CP5 依此类推。行校验如下图所示其中 RP0 ~ RP15 为十六个 Bit 位，表示 Row Parity（行极性）， RP0 为第 0、2、4、6、….252、254 个字节的极性 RP1-----1、3、5、7……253、255 RP2----0、1、4、5、8、9…..252、253 （处理 2 个 Byte，跳过 2 个 Byte） RP3---- 2、3、6、7、10、11…..254、255 （跳过 2 个 Byte，处理 2 个 Byte） RP4---- 处理 4 个 Byte，跳过 4 个

Byte； RP5---- 跳过 4 个 Byte，处理 4 个 Byte； RP6---- 处理 8 个 Byte，跳过 8 个 Byte RP7---- 跳过 8 个 Byte，处理 8 个 Byte； RP8---- 处理 16 个 Byte，跳过 16 个 Byte RP9---- 跳过 16 个 Byte，处理 16 个 Byte； RP10----处理 32 个 Byte，跳过 32 个 Byte RP11----跳过 32 个 Byte，处理 32 个 Byte； RP12----处理 64 个 Byte，跳过 64 个 Byte RP13----跳过 64 个 Byte，处理 64 个 Byte； RP14----处理 128 个 Byte，跳过 128 个 Byte RP15----跳过 128 个 Byte，处理 128 个 Byte；可见，RP0 ~ RP15 每个 Bit 位都是 128 个字节（也就是 128 行）即 128*8=1024 个 Bit 位求异或的结果。综上所述，对 256 字节的数据共生成了 6 个 Bit 的列校验结果，16 个 Bit 的行校验结果， 22 个 Bit。 Nand 中使用 3 个字节存放校验结共在果，多余的两个 Bit 位置 1。存放次序如下表所示：以 K9F1208 为例，每个 Page 页包含 512 字节的数据区和 16 字节的 OOB 区。前 256 字节数据生成 3 字节 ECC 校验码，后 256 字节数据生成 3 字节 ECC 校验码，共 6 字节 ECC 校验码存放在 OOB 区中，存放的位置为 OOB 区的第 0、1、2 和 3、6、7 字节。校验码生成算法的 C 语言实现在 Linux 内核中 ECC 校验算法所在的文件为 drivers/mtd/nand/nand_ecc.c，其实现有新、旧两种，在，其实现有新、旧两种， 2.6.27 及更早的内核中使用的程序，从 2.6.28 开始已经不再使用，及更早的内核中使用的程序，开始已经不再使用，而换成了效率更高的程序。而换成了效率更高的程序。可以在 Documentation/mtd/nand_ecc.txt 文件中找到对新程序的详细介绍。详细介绍。首先分析一下 2.6.27 内核中的 ECC 实现，源代码见:

http://lxr.linux.no/linux+v2.6.27/drivers/mtd/nand/nand_ec c.c /*

Pre-calculated 256-way 1 byte column parity */ static const u_char nand_ecc_precalc_table[] = { 0x00, 0x55, 0x56, 0x03, 0x59, 0x0c, 0x0f, 0x5a, 0x5a, 0x0f, 0x0c, 0x59, 0x03, 0x56, 0x55, 0x00, 0x65, 0x30, 0x33, 0x66, 0x3c, 0x69, 0x6a, 0x3f, 0x3f, 0x6a, 0x69, 0x3c, 0x66, 0x33, 0x30, 0x65, 0x66, 0x33, 0x30, 0x65, 0x3f, 0x6a, 0x69, 0x3c, 0x3c, 0x69, 0x6a, 0x3f, 0x65, 0x30, 0x33, 0x66, 0x03, 0x56, 0x55, 0x00, 0x5a, 0x0f, 0x0c, 0x59, 0x59, 0x0c, 0x0f, 0x5a, 0x00, 0x55, 0x56, 0x03, 0x69, 0x3c, 0x3f, 0x6a, 0x30, 0x65, 0x66, 0x33, 0x33, 0x66, 0x65, 0x30, 0x6a, 0x3f, 0x3c, 0x69, 0x0c, 0x59, 0x5a, 0x0f, 0x55, 0x00, 0x03, 0x56, 0x56, 0x03, 0x00, 0x55, 0x0f, 0x5a, 0x59, 0x0c, 0x0f, 0x5a, 0x59, 0x0c, 0x56, 0x03, 0x00, 0x55, 0x55, 0x00, 0x03, 0x56, 0x0c, 0x59, 0x5a, 0x0f, 0x6a, 0x3f, 0x3c, 0x69, 0x33, 0x66, 0x65, 0x30, 0x30, 0x65, 0x66, 0x33, 0x69, 0x3c, 0x3f, 0x6a, 0x6a, 0x3f, 0x3c, 0x69, 0x33, 0x66, 0x65, 0x30, 0x30, 0x65, 0x66, 0x33, 0x69, 0x3c, 0x3f, 0x6a, 0x0f, 0x5a, 0x59, 0x0c, 0x56, 0x03, 0x00, 0x55, 0x55, 0x00, 0x03, 0x56, 0x0c, 0x59, 0x5a, 0x0f, 0x0c, 0x59, 0x5a, 0x0f, 0x55, 0x00, 0x03, 0x56, 0x56, 0x03, 0x00, 0x55, 0x0f, 0x5a, 0x59, 0x0c, 0x69, 0x3c, 0x3f, 0x6a, 0x30, 0x65, 0x66, 0x33, 0x33, 0x66, 0x65, 0x30, 0x6a, 0x3f, 0x3c, 0x69, 0x03, 0x56, 0x55, 0x00, 0x5a, 0x0f, 0x0c, 0x59, 0x59, 0x0c, 0x0f, 0x5a, 0x00, 0x55, 0x56, 0x03, 0x66, 0x33, 0x30, 0x65, 0x3f, 0x6a, 0x69, 0x3c, 0x3c, 0x69, 0x6a, 0x3f, 0x65, 0x30, 0x33, 0x66, 0x65, 0x30, 0x33, 0x66, 0x3c, 0x69, 0x6a, 0x3f, 0x3f, 0x6a, 0x69, 0x3c, 0x66, 0x33, 0x30, 0x65, 0x00, 0x55, 0x56, 0x03, 0x59, 0x0c, 0x0f,

0x5a, 0x5a, 0x0f, 0x0c, 0x59, 0x03, 0x56, 0x55, 0x00 }; 为了加快计算速度，程序中使用了一个预先计算好的列极性表。这个表中每一个元素都是 unsigned char 类型，表示 8 位二进制数。表中 8 位二进制数每位的含义：这个表的意思是：对 0~255 这 256 个数，计算并存储每个数的列校验值和行校验值，以数作数组下标。比如 nand_ecc_precalc_table[ 13 ] 存储 13 的列校验值和行校验值， 13 的二进制表示为 00001101，其 CP0 =

Bit0^Bit2^Bit4^Bit6 = 0； CP1 = Bit1^Bit3^Bit5^Bit7 = 1； CP2 = Bit0^Bit1^Bit4^Bit5 = 1; CP3 = Bit2^Bit3^Bit6^Bit7 = 0; CP4 = Bit0^Bit1^Bit2^Bit3 = 1; CP5 = Bit4^Bit5^Bit6^Bit7 = 0; 其行极性 RP = Bit0^Bit1^Bit2^Bit3^Bit4^Bit5^Bit6^Bit7 = 1；则

nand_ecc_precalc_table[ 13 ] 处存储的值应该是 0101 0110，即 0x56. 注意，数组 nand_ecc_precalc_table 的下标其实是我们要校验的一个字节数据。理解了这个表的含义，也就很容易写个程序生成这个表了。程序见附件中的 MakeEccTable.c 文件。有了这个表，对单字节数据 dat，可以直接查表 nand_ecc_precalc_table[ dat ] 得到 dat 的行校验值和列校验值。但是 ECC 实际要校验的是 256 字节的数据，需要进行 256 次查表，对得到的 256 个查表结果进行按位异或，最终结果的 Bit0 ~ Bit5 即是 256 字节数据的 CP0 ~ CP5. /* Build up column parity */ for(i = 0; i < 256; i++) { /* Get CP0 - CP5 from table */ idx = nand_ecc_precalc_table[*dat++]; reg1 ^= (idx & 0x3f); //这里省略了一些，后面会介绍 } Reg1 在这里，计算列极性的过程其实是先在一个字节数据的内部计算 CP0 ~ CP5, 每个字节都计算完后再与其它字节的计算结果求异或。而表 1 中是先对一列 Bit0 求异或，再去异或一列

Bit2。这两种只是计算顺序不同，结果是一致的。因为异或运算的顺序是可交换的。行极性的计算要复杂一些。 nand_ecc_precalc_table[] 表中的 Bit6 已经保存了每个单字节数的行极性值。对于待校验的 256 字节数据，分别查表，如果其行极性为 1，则记录该数据所在的行索引（也就是 for 循环的 i 值），这里的行索引是很重要的，因为 RP0 ~ RP15 的计算都是跟行索引紧密相关的，如 RP0 只计算偶数行，RP1 只计算奇数行，等等。 /* Build up column parity */ for(i = 0; i < 256; i++) { /* Get CP0 - CP5 from table */ idx = nand_ecc_precalc_table[*dat++]; reg1 ^= (idx & 0x3f); /* All bit XOR = 1 ? */ if (idx & 0x40) { reg3 ^= (uint8_t) i; reg2 ^= ~((uint8_t) i); } } 这里的关键是理解第 88 和 89 行。 Reg3 和 reg2 都是 unsigned char 型的变量，并都初始化为零。行索引（也就是 for 循环里的 i）的取值范围为 0~255，根据表 2 可以得出以下规律： RP0 只计算行索引的 Bit0 为 0 的行，RP1 只计算行索引的 Bit0 为 1 的行； RP2 只计算行索引的 Bit1 为 0 的行，RP3 只计算行索引的 Bit1 为 1 的行； RP4 只计算行索引的 Bit2 为 0 的行，RP5 只计算行索引的 Bit2 为 1 的行； RP6 只计算行索引的 Bit3 为 0 的行，RP7 只计算行索引的 Bit3 为 1 的行； RP8 只计算行索引的 Bit4 为 0 的行，RP9 只计算行索引的 Bit4 为 1 的行； RP10 只计算行索引的 Bit5 为 0 的行，RP11 只计算行索引的 Bit5 为 1 的行； RP12 只计算行索引的 Bit6 为 0 的行，RP13 只计算行索引的 Bit6 为 1 的行； RP14 只计算行索引的 Bit7 为 0 的行，RP15 只计算行索引的 Bit7 为 1 的行；已经知道，异或运算的作用是判断比特位为 1 的个数，跟比特位为 0 的个数没有关系。如果有偶数个 1 则异或的结果为 0，如果有奇数个 1 则异或的结果为 1。那么，程序第 88

行，对所有行校验为 1 的行索引按位异或运算，作用便是：判断在所有行校验为 1 的行中，属于 RP1 计算范围内的行有多少个------由 reg3 的 Bit 0 指示，0 表示有偶数个，1 表示有奇数个；属于 RP3 计算范围内的行有多少个------由 reg3 的 Bit 1 指示，0 表示有偶数个，1 表示有奇数个；属于 RP5 计算范围内的行有多少个------由 reg3 的 Bit 2 指示，0 表示有偶数个，1 表示有奇数个；属于 RP7 计算范围内的行有多少个------由 reg3 的 Bit 3 指示，0 表示有偶数个，1 表示有奇数个；属于 RP9 计算范围内的行有多少个------由 reg3 的 Bit 4 指示，0 表示有偶数个，1 表示有奇数个；属于 RP11 计算范围内的行有多少个------由 reg3 的 Bit 5 指示，0 表示有偶数个，1 表示有奇数个；属于 RP13 计算范围内的行有多少个------由 reg3 的 Bit 6 指示，0 表示有偶数个，1 表示有奇数个；属于 RP15 计算范围内的行有多少个------由 reg3 的 Bit 7 指示，0 表示有偶数个，1 表示有奇数个；所以，reg3 每个 Bit 位的作用如下表所示： Reg3 第 89 行，对所有行校验为 1 的行索引按位取反之后，再按位异或，作用就是判断比特位为 0 的个数。比如 reg2 的 Bit0 为 0 表示：所有行校验为 1 的行中，行索引的 Bit0 为 0 的行有偶数个，也就是落在 RP0 计算范围内的行有偶数个。所以得到结论：在所有行校验为 1 的行中，属于 RP0 计算范围内的行有多少个------由 reg2 的 Bit 0 指示，0 表示有偶数个，1 表示有奇数个；属于 RP2 计算范围内的行有多少个------由 reg2 的 Bit 1 指示，0 表示有偶数个，1 表示有奇数个；属于 RP4 计算范围内的行有多少个------由 reg2 的 Bit 2 指示，0 表示有偶数个，1 表示有奇数个；属于 RP6 计算范围内的行有多少个------由 reg2 的 Bit 3 指示，0 表示有偶数个，1 表示有奇数个；属于 RP8 计算范围内的行有多少个

------由 reg2 的 Bit 4 指示，0 表示有偶数个，1 表示有奇数个；属于 RP10 计算范围内的行有多少个------由 reg2 的 Bit 5 指示，0 表示有偶数个，1 表示有奇数个；属于 RP12 计算范围内的行有多少个------由 reg2 的 Bit 6 指示，0 表示有偶数个，1 表示有奇数个；属于 RP14 计算范围内的行有多少个------由 reg2 的 Bit 7 指示，0 表示有偶数个，1 表示有奇数个；所以，reg2 每个 Bit 位的作用如下表所示： Reg2 至此，只用了一个查找表和一个 for 循环，就把所有的校验位 CP0 ~ CP5 和 RP0 ~ RP15 全都计算出来了。下面的任务只是按照表 3 的格式，把这些比特位重新排列一下顺序而已。从 reg2 和 reg3 中抽取出 RP8~RP15 放在 tmp1 中，抽取出 RP0~RP7 放在 tmp2 中， Reg1 左移两位，低两位置 1，然后把 tmp2, tmp1, reg1 放在 ECC 码的三个字节中。程序中还有 CONFIG_MTD_NAND_ECC_SMC，又进行了一次取反操作，暂时还不知为何。 ECC 纠错算法当往 NAND Flash 的 page 中写入数据的时候，每 256 字节我们生成一个 ECC 校验和，称之为原 ECC 校验和，保存到 PAGE 的 OOB （out-of-band）数据区中。当从 NAND Flash 中读取数据的时候，每 256 字节我们生成一个 ECC 校验和，称之为新 ECC 校验和。将从 OOB 区中读出的原 ECC 校验和新 ECC 校验和按位异或，若结果为 0，则表示不存在错（或是出现了 ECC 无法检测的错误）；若 3 个字节异或结果中存在 11 个比特位为 1，表示存在一个比特错误，且可纠正； 3 个字节异或结果中只存在 1 个比特位为 1，若表示 OOB 区出错；其他情况均表示出现了无法纠正的错误。假设 ecc_code_raw[3] 保存原始的 ECC 校验码， ecc_code_new[3] 保存新计算出的 ECC 校验码，其格式如下表所示：对 ecc_code_raw[3] 和 ecc_code_new[3] 按位异或，得到的结果三个字节分

别保存在 s0,s1,s2 中，如果 s0s1s2 中共有 11 个 Bit 位为 1，则表示出现了一个比特位错误，可以修正。定位出错的比特位的方法是，先确定行地址（即哪个字节出错），再确定列地址（即该字节中的哪一个 Bit 位出错）。确定行地址的方法是，设行地址为 unsigned char byteoffs，抽取 s1 中的 Bit7,Bit5,Bit3,Bit1，作为 byteoffs 的高四位，抽取 s0 中的

Bit7,Bit5,Bit3,Bit1 作为 byteoffs 的低四位，则 byteoffs 的值就表示出错字节的行地址（范围为 0 ~ 255）。确定列地址的方法是：抽取 s2 中的 Bit7,Bit5,Bit3 作为 bitnum 的低三位，bitnum 其余位置 0，则 bitnum 的表示出错 Bit 位的列地址（范围为 0 ~ 7）。下面以一个简单的例子探索一下这其中的奥妙。假设待校验的数据为两个字节， 0x45 （二进制为 0100 0101） 0x38 和（二进制为 0011 1000），其行列校验码如下表所示：从表中可以计算出 CP5 ~ CP0 的值，列在下表的第一行（原始数据）。假设现在有一个数据位发生变化，0x38 变为 0x3A，也就是 Byte1 的 Bit 1 由 0 变成了 1，计算得到新的 CP5 ~ CP0 值放在下表第 2 行（变化后数据）。新旧校验码求异或的结果放在下表第三行。可见，当 Bit1 发生变化时，列校验值中只有 CP1，CP2，CP4 发生了变化，而 CP0，CP3，CP5 没变化，也就是说 6 个 Bit 校验码有一半发生变化，则求异或的结果中有一半为 1。同理，行校验求异或的结果也有一半为 1。这就是为什么前面说 256 字节数据中的一个 Bit 位发生变化时，新旧 22Bit 校验码求异或的结果中会有 11 个 Bit 位为 1。再来看怎么定位出错的 Bit 位。以列地址为例，若 CP5 发生变化（异或后的 CP5=1），则出错处肯定在 Bit 4 ~ Bit 7 中；若 CP5 无变化（异或后的 CP5=0）,则出错处在 Bit 0 ~ Bit 3 中，这样就筛选掉了一半的 Bit 位。剩下的 4 个 Bit 位

中，再看 CP3 是否发生变化，又选出 2 个 Bit 位。剩下的 2Bit 位中再看 CP1 是否发生变化，则最终可定位 1 个出错的 Bit 位。下面的树形结构更清晰地展示了这个判决过程：图表 1 出错 Bit 列地址定位的判决树注意：图中的 CP 指的是求异或之后的结果中的 CP 为什么只用 CP4，CP2，CP0 呢？其实这里面包含冗余信息，因为 CP5=1 则必有 CP4=0， CP5=0 则必有 CP4=1，也就是 CP5 跟 CP4 一定相反，同理，CP3 跟 CP2 一定相反，CP1 跟 CP0 一定相反。所以只需要用一半就行了。这样，我们从异或结果中抽取出 CP5，CP3，CP1 位，便可定位出错 Bit 位的列地址。比如上面的例子中 CP5/CP3/CP1 = 001，表示 Bit 1 出错。同理，行校验 RP1 发生变化，抽取 RP1，可知 Byte 1 发生变化。这样定位出 Byte 1 的 Bit 0 出错。当数据位 256 字节时，行校验使用 RP0 ~ RP15，抽取异或结果的 RP15，RP13，RP11，RP9，RP7，RP5，RP3，RP1 位便可定位出哪个 Byte 出错，再用 CP5,CP3,CP1 定位哪个 Bit 出错。

1 编码

设输入信息多项式I(x)=I0+I1x+…+Ik-1xk-1，校验多项式P(x)=P0+P1x+P2x2+Pn-k-1xn-k-1,则x2tI(x)对生成多项式g(x)求模得到的余式就是校验多项式P(x)，即P(x)= x2tI(x)(mod g(x))，那么生成码子的多项式为C(x)= x2tI(x)+ P(x)。所以BCH码编码的实质就是以生成多项式g(x)为模的除法问题。通常采用LFSR(线性反馈移位寄存器)来实现。具体编码算法如下：

for (i = 0; i < length - k; i++)

bb[i] = 0;

// bb

for (i = k - 1; i >= 0; i--) { //矩阵乘法

feedback = data[i] ^ bb[length - k - 1];

if (feedback != 0) {

for (j = length - k - 1; j > 0; j--)

if (g[j] != 0)

bb[j] = bb[j - 1] ^ feedback;

else

bb[j] = bb[j - 1];

bb[0] = g[0] && feedback;

} else {

for (j = length - k - 1; j > 0; j--)

bb[j] = bb[j - 1];

bb[0] = 0;

}

因此编码的关键为：计算对应t的生成多项式，然后根据以上算法完成编码。

已有的c语言程序可以产生g(x)，以上算法实现参见ecc30_encoder.v代码。

代码可能的优化方向：

1. 可以将gg先用mux选择，然后产生bb_0[419:0]~bb_7[419:0] ，可以节省很多组合逻辑。

2. 数据按照8bit并行输入，首先产生bbxx_0=f(bb,g(x)，data_in)，然后利用bbxx_0产生bbxx_1=f(bbxx_0, g(x)，data_in)，依次类推，能否直接推倒出bbxx_x=f(bb,g(x),data_in)

2 译码

在所有的BCH译码算法中最常用是：Berlekamp一Massey迭代算法(简称BM法)。该算法主要分以下三步完成:

第一步：由接收到的R(x)计算伴随式S=(s1,s2，…，s2t);

第二步：根据伴随式S求错误位置多项式σ(x)=σtxt+σt-1xt-1+…+σ1x1+1

第三步：求解σ(x)的根(钱氏(Chien)搜索法)确定错误位置，并进行错误纠正。

2.1 计算伴随式

第一步：由接收到的R(x)计算伴随式S=(s1,s2，…，s2t)

设错误图样为E(x)，则R(x)=C(x)+E(x)

若信道产生t个错误，则

E(x)YtxYt1xltlt1...Y1xYixlil1i1t，式中YiGF(2)，x为错误

li位置数，说明错误发生在R(x)中的第n-li位，错误值是Yi。

R(x)=C(x)+E(x)=q(x)g(x)+r(x)，由码的生成多项式g(x)= m1(x) m3(x)…m2t-1(x)，可以得出αj时

R(x)qj(x)mj(x)rj(x)。式中mj(x)是α的最小多项式，且mj(x)是以αj为根，因此当x=

，所以伴随式S=(s1,s2，…，s2t)的计算转换为R(x)

sjR(j)qj(j)mj(j)rj(j)rj(j)除以g(x)的除法运算，相除之后的余式即为伴随式，伴随式中任何一个元素Sj不为0，则接收到的码元R(x)有错。

以上除法运算，C语言实现如下（为何转换成这个算法，待进一步分析）：

由3.2节可知，对于二进制BCH码，仅需计算S=(s1,s3，…，s2t-1)共t个值，硬件实现以上算法参见ecc30_decoder.v中line555~2122的部分，核心思想是通过

(1,2,3,...,8),(3,6,9,...,24),...,(60,120,180,...,480)共240个α值，求得其他α

（i*jki*jk），并根据以上C语言算法求得S=(s1,s3，…，s2t-1)。

α是伽罗华域GF(2m)的本原域元素，具有如下特性：

2，所以2mm1kk，2m101

代码可能的优化方向：

1. α相乘的单元能否进行优化（详见《纠错码—原理与方法》P172~174）---可以优

2化，m1kk可表示成次数小于m的α多项式表示（例如2m1kk0x1024，那么13个

bit对应位为1，则α对应次幂的系数为1，否则为0），因此

(a0a11a22a33...a1313)ka0ka11ka22ka33k...a1313k'''3'a0a1'1a22a3...a1313合并同类项，可

以得到相乘之后的结果，即系数

''''a0,a1',a2,a3,...,a13，yuming.wang编写了一个C语言程序完成

了以上合并同类项的推导和verilog文件的输出，参见ECC_old.C。

12383692460120180480(,,,...,),(,,,...,),...,(,,,...,)中有重复的部分，能2.

否复用？ ---无法复用，因为每次的被乘数不同

3. 取消双通道的功能：高通道的s计算逻辑全部可以删除

4. 取消读和纠错同时进行功能：syndrxx_latch可以删除

2.2 计算错误位置多项式

第二步：根据伴随式S求错误位置多项式σ(x)=σtxt+σt-1xt-1+…+σ1x1+1

构造错误位置多项式σ(x)=σtxt+σt-1xt-1+…+σ1x1+1，错误位置为该式的根。经过数学推演（详见《纠错码—原理与方法》P270）可知错误位置多项式的系数σ1, σ2,…，σt-1，σ

t和伴随式有如下关系：

求解该线性方程可得错误位置多项式的系数。工程上通过BM迭代算法求解σi。

σ(x)=σtxt+σt-1xt-1+…+σ1x1+1 （1）

S(x)1s1xs2x...six(Yjxij)xi2ii0i0j1t （2）

S(x)(x)(x)11x2x2... （3）

将（1）、（2）代入（3）并经过数学推演（详见《纠错码—原理与方法》P277），得到如下求σ(x)的关键方程：

S(x)(x)(x)(modx2t1)，BM迭代算法即求解该方程：选择一组或两组合理的初值

(0)(x)和(0)(x)，经过第一次迭代运算求得(1)(x)和(1)(x)，依次类推，由(i)(x)和(i)(x)求

(i1)(i1)(x)(x)，其间一共进行2t一1次迭代。迭代过程中定义第j+1步与第j步的差值得和

(j)(x)为dj，则有

djsj1si1j1ii(j) （4）

式中

i(j)是第j次迭代后

(j)2(j)D(j)(j)(x)11(j)x2x...D(j)xi中x的系数，

D(j)(j)(x)，经过数学推演有下列公式成立（详见《纠错码—原理与方法》P279）：

(j1)(x)(j)(x)djdi1xji(i)(x) （5）

(j1)(x)(j)(x)djdi1xji(i)(x) （6）

其中i是j前面的某一行，并满足i-D(i)最大，且di0而D(j1)max(D(j),jiD(i)),

迭代步骤如下：

(1)(1)(x)0，D(1)0，d11 (x)11. 由初值，

(0)(0)(x)0，D(0)0，d0s1 开始迭代 (x)1 ，

2. 由（4）计算

dj，若

dj0(j1)(j)(j1)(j)(x)(x)(x)(x)，，则有，

(j1)D(j1)jD(j)；若dj0，则找出j之前的某一行i，它在所有j行之前各行中的i-D(i)

最大，且

di0(j1)(j1)(x)(x) ，然后根据（5）、（6）计算和

3. 计算和(x)

dj1(2t)(2t)(x)(x)即为所求的(x)，重复（2）进行迭代，经过2t次迭代后得到和

二进制BCH码迭代算法可以进一步简化为如下步骤（数学推演详见《纠错码—原理与方法》P282）：

(1/2)(x)1，D(1/2)0，d1/21， 1. 初始值

(0)(x)1，D(0)0，d0s1 开始迭代

(j)(x)2. 计算

djs2j1si12j1ii(j)，若

dj0(j1)(j)d0(x)(x)，，则有 D(j1)D(j)；若j，

则找出j之前的某一行i，它的2i-D(i)最大，且

di0，计算

(j1)(x)(j)(x)djdi1x2(ji)(i)(x)

3. 计算

dj1(t)，重复2进行迭代，经过t次迭代后得到(x)即为所求的(x)

C语言实现如下：

硬件实现：

由以上算法可知在计算

dj时需要用到S=(s2,s4，…，s2t)，因此首先需要根据S=(s1,s3，…，

22s2s12,s4s2,...,s2ts2t1s2t-1)计算得到S=(s2，s4，…，s2t)(，由伴随式SEH及二进制BCH

T码校验矩阵的定义可得)，galois_mult.v是一个基本乘法单元，在计算S=(s2，s4，…，s2t)时即利用这一个基本乘法单元依次算出S=(s2，s4，…，s2t)，每个需要2cycle，共需2t个cycle完成计算。硬件中已将s2，s4，…，s2t的寄存器和编码寄存器复用。

之后完成以上BM迭代算法（利用的是2t次迭代算法）：

(j)(x)如果在计算

dj0，则(j1)(x)(j)(x)，D(j1)D(j)，然后利用

djsj1si1j1ii(j)计算

dj1，

dj1时利用基本乘法单元galois_mult.v进行相乘，同时累加通过异或完成。对应

ecc30_decoder_p.v中current_bm_state的如下状态跳转：

BM_STATE1->BM_STATE2->BM_STATE2_DU_UPDATE1->BM_STATE2_DU_UPDATE_NOP->BM_STATE2_LAST->BM_STATE_DONE

l_dec_bch_u代表第u次迭代之后的D[u]，l_dec_bch_uplus1代表第u次迭代之后的D[u+1]：即错误位置多项式中最高幂次

elp_u_0,elp_u_1,…,elp_u_30对应第u次迭代之后的错误位置多项式的系数

(u)(u)1(u),2,...,30

d_dec_bch_u代表第u次迭代之后的du

q代表找到的i-D[i]最大的i值,u_lu_q代表i-D[i]。

如果

dj0，则首先通过基本除法单元galois_divide.v计算

12n2di1，利用费尔马小定理的

2222(n1)求逆方法：令A（X）是有限域GF(2m)中的元素，则A(x)A(x)A(x)*A(x)*...*A(x)对应ecc30_decoder_p.v中current_bm_state的如下状态跳转：BM_STATE1->BM_STATE1_ELP_DIVIDE_INIT->BM_STATE1_ELP_TMP

求得

di1

之后，依次求得第u+1次迭代之后的错误位置多项式系数，并判断是否需要更

新q及u_lu_q，对应current_bm_state的如下状态跳转：

BM_STATE1_ELP_TMP->…->BM_STATE1_GET_Q。

之后计算

dj1，对应current_bm_state的如下状态跳转：

BM_STATE1_GET_Q->BM_STATE2->BM_STATE2_DU_UPDATE1->BM_STATE2_DU_UPDATE_NOP->BM_STATE2_LAST->BM_STATE_DONE

硬件可能的优化方向：

1、(s2，s4，…，s2t)的计算能否在(s1,s3，…，s2t-1)计算完成后即进行，从而节省纠错时间，目前(s2，s4，…，s2t)的计算是串行进行的，每个需要2cycle---暂不考虑

2、计数器的复用：在

dj0时计算

dj1时有一个计数器du_iterationg_cnt，在基本除

法单元中有一个计数器---暂不考虑

3、2t次迭代改为t次迭代算法—可以优化

2.3 计算错误位置

第三步：求解σ(x)的根(钱氏(Chien)搜索法)确定错误位置，并进行错误纠正。求解 (x)0的根就是确定R(x)中哪几位发生了错误，即确定那就需要验证(ni)ni是不是错误位置数，

是不是(x)0的根。若是，则第n一i位有错，否则就无错。依次对每一

位n一i(i=1,2,...,n)进行检验，最后得到(x)0的根，然后取反就得到相应的错误位置。这就是钱氏搜索法的基本思想。

判

((ni))1122...tti是否为0。

硬件实现：

从第8639bit开始进行计算，即取i=8639，利用基本乘法单元依次计算得到

18639,28639*2,...,t8639*t86398639*28639*t,,...,，其中已知，对应current_dec_state的如下状态

跳转：CAN_CORRECT_JUDGE->CHIN_SEARCH_INITIAL->CHIN_SEARCH_STATE1，计算得到的值寄存在syndr1_alpha_table~syndr30_alpha_table的alpha_value中。之后利用syndr1_alpha_table，syndr2_alpha_table,...,syndr30_alpha_table中的galois_mult_alpha_minusX单元计算得到

i8639*i*i*j,i1,2,...,30,j1,2,...,8639，一次计

算判断8个bit是否为错误多项式的根，然后依次对这个8个bit进行统计，共有几个出错的bit，出错位置分别是什么。对应current_dec_state的如下状态跳转：CHIN_SEARCH_STATE1-〉CHIN_SEARCH_ITER-〉…->ONE_CHANNEL_DONE。需要注意的是无论ECC模式是哪种，也不论编码时送入的bit数是多少个，钱搜索时固定从8639搜索到0，判断这8640个bit是否为错误多项式的根，错误位置永远是输入比特的绝对位置，而不是在8640bit中的相对位置，例如，输入待编码bit数为512B+3B+6bit，ecc模式为ecc7，那么编码后总bit数为(512+16)*8bit=4224，那么出错位置一定是在0~4223bit之间。

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文

全部栏目

ECC算法详解及硬件实现