1.是什么?
分布式的数据检索分析数据库.
2.干什么?
存储和检索数据信息
3.跟其他数据库的区别.
包含了多库多表跨字段的联想查询.可用于典型的 猜你喜欢 类似的关联性分析.有一个关联评估权重和关联信息的分组功能.是大数据获取有效数据,进行预测的基础.这是其他数据库没有的特性.
另外其分布式和默认对所有字段索引的属性使其在PB级别的数据量下也可以快速响应检索结果
4.如何使用?
java的库和rest风格的接口
PHP或者非java语言的应用主要是依赖第二种
PHP可以引入官方php库,其实质主要是curl请求elasticsearch提供的接口.
有两种请求方式:一种是简单url,动作和参数都在url中体现,另一种是在body中体现.
5.概念
index 索引\[相当于数据库\]: 数据存储的地方
type 类型\[相当于表\]: 相同结构的数据的集合
document 文档\[相当于表中的记录\]: 结构化的数据记录
6.具体使用
资源地址: 格式 /\_index/\_type/{\_id} 其中\_id 唯一标识一条文档
操作方式:
存在:开放的接口是通过head方法请求验证
curl -i -XHEAD[http://localhost:9200/website/blog/123](http://localhost:9200/website/blog/123)
但建议用查询GET,替代HEAD
增:
新增es自然生产\_id的文档记录
PUT /{index}/{type}/{id}
{
"field": "value",
...[elastic-search](elastic-search.md)
}
响应:es创建\_id的新建索引信息,自动生成的ID有22个字符长,URL-safe, Base64-encoded string universally unique identifiers, 或者叫 UUIDs。
{
"\_index": "website",
"\_type": "blog",
"\_id": "wM0OSFhDQXGZAWDf0-drSA",
"\_version": 1,
"created": true
}
删:
删除指定\_id的文档
DELETE /website/blog/123
响应
{
"found" : true, //成功返回200,未找到返回404
"\_index" : "website",
"\_type" : "blog",
"\_id" : "123",
"\_version" : 3, //任何操作都会导致版本增加,这是用来指导集群节点能正确处理和响应的机制.可能有锁的机制避免并发操作
}
改:
更新指定文档或写入自定义\_id的记录
PUT /website/blog/123
{
"title": "My first blog entry",
"text": "Just trying this out...",
"date": "2014/01/01"
}
响应:文档索引创建信息
{
"\_index": "website",
"\_type": "blog",
"\_id": "123",
"\_version": 1,
"created": true
}
查:
根据\_id检索文档
GET /website/blog/123?pretty
响应:存储文档时的索引信息及元数据
{
"\_index" : "website",
"\_type" : "blog",
"\_id" : "123",
"\_version" : 1,
"found" : true, //即使没有找到记录也会返回数据,此处found会显示false
"\_source" : {
"title": "My first blog entry",
"text": "Just trying this out...",
"date": "2014/01/01"
}
}
清空
query\_string: 指导行为细节的指标
pretty:美化响应输出
\_source:仅显示需要响应的元数据字段
op\_type:明确主行为的细节.因为主行为可能有二义,比如PUT通常为更新操作,需要指定文档\_id,这时设置op\_type=create,行为会被理解为新建一个自定义\_id的文档.新建成功返回201\[created\]如果已存在,新增失败返回409\[conflict\]
这里可以直接等于
\_create
version:对指定版本的文档进行操作
\_update:局部更新文档.
结构化\[DSL\]查询
通常查询必有query
bool是支持符合查询的标识,
bool查询的目的是为了更多的匹配来计算分数.其查询语句是可以嵌套的.
答案在于分值是如何计算的。bool查询会运行每个match查询,将它们的分值相加,然后乘以匹配的查询子句的数量,最后除以所有查询子句的数量。相同层次的每个子句都拥有相同的权重。
其分值会被顶层
must 是一定要
must not是一定不要
should 是不必要,但只要有会增加关联性评分
term是 == 完全匹配
terms是 in\_array 匹配
match是分词匹配
字符串类型文档字段会有两种查询类型
keyword 未分词
text 包含分词
wildcard 模糊匹配 需要通配符\*来代替模糊
#6
elasticsearch 提示Parse Failure \[No mapping found for \[filed\] in order to sort on\]\] 的解决办法
排序代码如下:
`{ "sort": [ { "timestamp": { "order": "desc" } } ] }`
修改后:
`{ "sort": [ { "timestamp": { "unmapped_type": "long"} } ] }`
默认匹配评分\_score 较大的排序靠前
| 一级分类 | 二级分类 | 具体类型 |
| --- | --- | --- |
| 核心类型 | 字符串类型 | string,text,keyword |
| 整数类型 | integer,long,short,byte |
| 浮点类型 | double,float,half\_float,scaled\_float |
| 逻辑类型 | boolean |
| 日期类型 | date |
| 范围类型 | range |
| 二进制类型 | binary |
| 复合类型 | 数组类型 | array |
| 对象类型 | object |
| 嵌套类型 | nested |
| 地理类型 | 地理坐标类型 | geo\_point |
| 地理地图 | geo\_shape |
| 特殊类型 | IP类型 | ip |
| 范围类型 | completion |
| 令牌计数类型 | token\_count |
| 附件类型 | attachment |
| 抽取类型 | percolator |
- 常见功能
- 第三方授权登录
- 邮件发送
- 简易聊天室
- 获取各国汇率
- PHP获取服务器硬件指标
- 数据上报之
- web开发
- 开发规范
- 前端
- 踩坑
- 将footer固定在底部
- bootstrap
- Metronic
- 用到的jquery插件
- bootstrap-hover-dropdown
- jquery.slimscroll
- jquery.blockui
- bootstrap-switch
- js.cookie
- moment
- bootstrap-daterangepicker
- morris
- raphael
- jquery.waypoints
- jquery.counterup
- select2
- 取值和设置默认值
- vue
- axios
- 浏览器
- 谷歌浏览器
- 谷歌插件
- layui
- layui-表格
- layui-表单
- layui-弹窗
- layui-分页
- 后端
- 操作系统
- linux
- 用户管理
- 文件管理
- 目录管理
- 压缩和解压缩
- 进程查看
- 端口查看
- 开机自启动服务
- 定时任务
- shell脚本
- 杀掉运行超过指定时长指定服务的进程
- 获取服务器使用状态
- bash-shell连接socket
- 自定义快捷命令
- centos-踩坑
- 防火墙
- 软件
- yum
- vim
- screen
- window
- 语言
- PHP
- 配置优化
- 框架
- thinkphp5.1+
- think命令行
- laravel6.+
- 维护模式
- 根据环境读取不同配置
- laravel6.+采坑
- laravel坑位
- 数据库事务
- 任务调度
- 文件权限问题
- 增强框架
- larvel:elastic-search
- 图形验证码
- laravel获取ip
- 函数
- strtotime
- 正则匹配
- 类
- 接口类与抽象类
- 类相关的关键字 - abstract
- 类相关的关键字 - interface
- PHP有关类的调用方式"->"与"::"的区别
- 扩展
- 问题归纳
- json_encode和json_decode
- 字符串的运算
- curl
- 优化php效率
- 数组相加合并与array_merge
- 时区转换
- 不常用特性
- php反射
- 包管理器-composer
- GuzzleHttp
- Python
- Go
- 数据库
- Redis
- 安装
- 本地化-数据备份
- php-redis操作
- Mysql
- mysql-命令集合
- 设置终端可访问
- 数据库设计
- 用户基础信息表
- 踩坑集合
- mysql-2002
- mysql-2054
- 优化策略
- mysql-密码验证插件
- 一些牛逼的sql查询
- topN
- 无限级分类
- Memcache
- MongoDb
- 安装mongo-server
- 安装php-mongodb扩展
- 在laravel中使用mongoDB
- 客户端软件
- Hbase
- Elasticsearch
- elastic-search
- restfulApi操作es
- web服务器
- 1.nginx
- 配置语法规则
- 配置详解
- rewrite规则
- request_filename
- 2.apache
- 功能设计
- 加密解密
- Base64
- 对亚马逊SKU加密
- 兼职项目中的加解密
- 腾讯外包时的加密
- 接口设计
- 接口限流设计
- 分库分表
- 遍历展示文件目录结构
- 时区换算
- 文件切割
- 解析xml字符串
- 项目
- 博客后台管理
- 亚马逊广告API
- 官方指引文档
- 开发人员中心
- 应用商店
- 第三方库
- 申请API邮件记录
- 亚马逊MWS
- 付款报告
- 乱码
- 亚马逊管理库存报告
- 报告
- 商品
- 入库
- 履行
- 出库
- 财务
- 订单
- 异步任务处理
- 集群如何同步代码
- 基本开发流程
- 文档管理
- showdoc
- 运行环境
- 开发环境
- vagrant
- windows上配置安装
- vagrant安装插件缓慢
- 更换ssh默认端口映射
- 设置x-shell密码登录
- 使用市场的box-homestead
- homestead-7: Box 'lc/homestead'
- 常见问题
- 虚拟环境reboot
- 突然无法使用
- phpStudy
- wamp
- 压测性能
- VPN
- vultr
- 凌空图床
- 宝塔
- 自动化部署
- 版本管理软件钩子
- 线上环境-LNMP
- centos7
- nginx
- mysql
- mysql开机自启
- mysql-更换默认端口
- datetime字段类型默认值
- php
- php扩展安装
- redis
- swoole
- gd
- BCMath
- igbinary
- zstd
- 包管理器:composer
- 优化性能
- nodejs
- 更新gcc版本
- 版本控制
- git
- 常用命令
- gitlab
- 版本管理规范
- 使用阿里云创建远程仓库
- git自动化部署
- svn
- 忽略指定文件
- 拉取代码
- 自动化运维
- jekins
- 容器
- 集群
- 架构设计
- 设计原则
- 阅读参考
- 代码规划
- 架构实战
- 服务治理
- 权限控制设计
- 具体设计
- 计划
- 疑问知识点
- 读书笔记
- 高性能Mysql
- TCP-IP详解-卷一:协议
- 思考
- php如何实现并发执行
- 对接调用设计
- 如何在浏览器上实现插件
- 如何设计一个app结合业务告警
- mysql的where查询没有用到索引
- 为啥in查询比循环嵌套sql的查询还要慢
- 使用git来创建属于自己的composer包
- 翻页获取数据的时候又新增了数据
- 安全思路
- 月报
- PHP ?? 和 ?: 的区别
- PHP异步执行
- redis集群的目标是什么
- 大文件数据处理
- 性能瓶颈分析
- 命令行里输出带颜色的字体
- 面试问题合集
- 基础
- 安全
- 算法
- 冒泡排序
- 快速排序
- 二分法查询数组指定成员
- 字符查找匹配
- 令牌桶
- 漏桶
- 计数器
- 代理
- 协议
- http
- 状态码
- tcp
- udp
- Oauth2.0
- 设计模式
- 单例模式
- 适配器模式
- 工厂模式
- 观察者模式
- 流程化
- 地址栏输入网址到返回网页的流程
- 题目收集
- 工具
- rabbitMq
- rabbitMQ用户管理
- 生产者
- 消费者
- 支持TP5.*的think-queue
- 消息丢失
- 消费者报错
- rabbitMQ配置优化
- 磁盘满载导致服务挂掉
- PHP类库
- rabbitMQ踩坑
- navicat
- vscode
- phpstorm
- 激活码
- markdown
- PHP自定义类库
- 工具类
- 领导力
- 任务分配
- 代码组织
- 不要重复
- 避免污染
- 接口定义规范
- 小业务需求
- 获取充值面额组成
- 监控服务器CPU和内存
- shell脚本版本