博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
跨平台语料处理备忘
阅读量:6940 次
发布时间:2019-06-27

本文共 153 字,大约阅读时间需要 1 分钟。

接手他人给的语料时

1.先dos2unix,然后去重;

自己制作语料时

1.注意不要在词条后面加空格。检测办法:按左右箭头键检测行上是否加入了不该加入的空格;

2. 文件的最后一行内容上要按回车键,不然到linux下vim会有neol标识,dos2unix也无效。这种文件状态可能会导致算法运行结果不正确。

 

转载地址:http://oywnl.baihongyu.com/

你可能感兴趣的文章
laravel 调试工具
查看>>
从发明新的排序算法开始扯淡
查看>>
提高设计感的几个网站
查看>>
使用 JavaScript 修改浏览器 URL 地址栏
查看>>
在线查询12306账号是否泄露
查看>>
思考:如何打造一个优秀的研发体系?
查看>>
倒霉(续-)
查看>>
hbase 线程池问题处理
查看>>
iOS UIGestureRecognizer (手势的基本知识介绍)
查看>>
oracle向已有表增加字段、字段设置默认值、修改表字varchar类型的长度
查看>>
文件特殊权限suid、sgid、stick_bit、软链接、硬链接
查看>>
/etc/init.d/httpd start 和 service httpd start区别
查看>>
struts2 <s:textfield />中的日期格式化输出
查看>>
使用JFreeChart-创建Multiple图
查看>>
一个男人角度告诉你“如何选婚姻”,请谨慎对待‘爱情’
查看>>
源码编译详解
查看>>
Java对象的序列化和反序列化
查看>>
《疯狂Java讲义》学习笔记(四)流程控制与数组
查看>>
spring 配置多数据源
查看>>
JDK的动态代理实现原理分析:
查看>>