python 使用 nltk 模块进行分词等自然语言处理时,如果没有提前安装 punkt,会报出 Resource punkt not found 错误,那下面介绍如何解决该问题。
解决方法
错误信息中,可能会包含如下解决方法:
>>> import nltk
>>> nltk.download('punkt')
但是很有可能,实际操作中会报 Connection refused 或 ssl 验证等错误,那就需要进行笔者提供的下一步解决方案。
- 到官方网站下载地址:https://github.com/nltk/nltk_data/blob/gh-pages/packages/tokenizers/punkt.zip 下载 punkt 压缩包;
-
解压后,在如下目录之一(如没有就新建)下建立 tokenizers 目录,然后将解压的 punkt 文件夹迁移到该目录下;
Attempted to load tokenizers/punkt/PY3/english.pickle Searched in: - '/Users/xxx/nltk_data' - '/usr/share/nltk_data' - '/usr/local/share/nltk_data' - '/usr/lib/nltk_data' - '/usr/local/lib/nltk_data' - ''