在本章中,我们将学习如何开始使用自然语言工具包(软件包)。
前提条件
如果想用自然语言处理来构建应用程序,那么上下文中的变化就会使其变得非常困难。 语境因素影响机器如何理解特定句子。 因此,我们需要通过使用机器学习方法来开发自然语言应用程序,以便机器也能够理解人类可以理解上下文的方式。
要构建这样的应用程序,我们将使用名为 NLTK (自然语言工具包包)的 Python 包。
在使用之前需要安装 NLTK,它可以在以下命令来安装 -
pip install nltk
要为 NLTK 构建 conda 包,请使用以下命令 -
conda install -c anaconda nltk
现在安装 NLTK 包后,需要通过 python 命令提示符导入。通过在 Python 命令提示符下编写以下命令来导入它 -
>>> import nltk
下载 NLTK 的数据
现在导入NLTK 后,我们还需要下载所需的数据。 它可以在 Python 命令提示符下通过以下命令完成 -
>>> nltk.download()
安装其他必需的软件包
为了使用 NLTK 构建自然语言处理应用程序,需要安装必要的软件包。如下 -
gensim
它是一个强大的语义建模库,对许多应用程序很有用。可以通过执行以下命令来安装它 -
pip install gensim
pattern
它用于使 gensim
包正常工作。可以通过执行以下命令来安装它 -
pip install pattern