ThinkChat🤖让你学习和工作更高效,注册即送10W Token,即刻开启你的AI之旅 广告
# Standard Analyzer(标准分析器) standard(标准)分析器是默认分析器,如果没有指定分析器,则使用该分析器。它提供基于语法的标记(基于Unicode文本分段算法,如Unicode标准附件29中所述),并且用于大多数语言。 ##### **定义** 它包括: 分词器 * 标准分词器 词语过滤器 * 标准词语过滤器 * 小写词语过滤器 * 停止词过滤器(默认情况下禁用) ##### **输出示例** ``` POST _analyze { "analyzer": "standard", "text": "The 2 QUICK Brown-Foxes jumped over the lazy dog's bone." } ``` 上述的句子将产生以下的词语: ``` [ the, 2, quick, brown, foxes, jumped, over, the, lazy, dog's, bone ] ``` ##### **配置** standard(标准)分析器接受以下的参数: | `max_token_length` | 最大词语长度。如果看到超过此长度的词语,则以max_token_length分割。默认为255。 | | `stopwords` | 预定义的停止词列表,如_english或包含停止词列表的数组。默认为\_none_。 | | `stopwords_path` | 包含停止词的文件路径。 | 有关停止词配置的更多信息,请参阅Stop Token Filter(停止词过滤器)。 ##### **配置示例** 在这个示例中,我们将standard(标准)分析器的max_token_length值配置为5(用于演示目的),并使用预定义的英文停止词列表: ``` PUT my_index { "settings": { "analysis": { "analyzer": { "my_english_analyzer": { "type": "standard", "max_token_length": 5, "stopwords": "_english_" } } } } } POST my_index/_analyze { "analyzer": "my_english_analyzer", "text": "The 2 QUICK Brown-Foxes jumped over the lazy dog's bone." } ``` 以上示例产生以下词语: ``` [ 2, quick, brown, foxes, jumpe, d, over, lazy, dog's, bone ] ``` 原文链接 : [https://www.elastic.co/guide/en/elasticsearch/reference/5.3/getting-started.html](https://www.elastic.co/guide/en/elasticsearch/reference/5.3/getting-started.html)(修改该链接为官网对应的链接) 译文链接 : [http://www.apache.wiki/display/Elasticsearch](http://www.apache.wiki/display/Elasticsearch)(修改该链接为 **ApacheCN** 对应的译文链接) 贡献者 : [曾少峰](/display/~zengshaofeng),[ApacheCN](/display/~apachecn),[Apache中文网](/display/~apachechina)