条件随机场的理论实在令人头疼,上来就介绍概率无向图,我是基本没看懂😹.而且又要准备别的东西,很难静心看下去,最后还是看苏神的博客大致了解了,因此这次的代码我也主要是修改了苏神的代码.

NOTE 我写可视化的时候也发现了crf的状态转移矩阵的变化比较缓慢,然后搜索了一份果然苏神也发现这个问题,并且给出了增大学习率的解决方案,因此我也在代码中实现了crf层的学习率修改方案,最终效果的确相当明显了.

原理

建议大家参考苏神的博客

实际上李航书里面的讲的也是线性链条件随机场,书里面一开始讲概率无向图,然后介绍最大团等等,这样很难对线性条件随机场有一个直接的认识.实际上对于标注问题,条件随机场就是输入一个序列,通过状态转移矩阵对输出序列进行控制,实际上是学习到输出序列间的关系. 具体的公式推导请大家参考李航书以及苏神的博客,我就不献丑了.