接手他人给的语料时
1.先dos2unix,然后去重;
自己制作语料时
1.注意不要在词条后面加空格。检测办法:按左右箭头键检测行上是否加入了不该加入的空格;
2. 文件的最后一行内容上要按回车键,不然到linux下vim会有neol标识,dos2unix也无效。这种文件状态可能会导致算法运行结果不正确。
本文共 153 字,大约阅读时间需要 1 分钟。
接手他人给的语料时
1.先dos2unix,然后去重;
自己制作语料时
1.注意不要在词条后面加空格。检测办法:按左右箭头键检测行上是否加入了不该加入的空格;
2. 文件的最后一行内容上要按回车键,不然到linux下vim会有neol标识,dos2unix也无效。这种文件状态可能会导致算法运行结果不正确。
转载地址:http://oywnl.baihongyu.com/