(相关资料图)
ES除了拥有索引上的优势,最重要的还是数据的结构,这都是ES为什么效率高,会使用它的原因。
1,结构化数据 VS 非结构化数据
结构化数据:也称作行数据,关系型数据库进行存储和管理,是由二维表结构来逻辑表达和实现(可以使用行、列来表现)的数据,严格地遵循数据格式与长度规范。非结构化数据:又可称为全文数据,不定长或无固定格式,不适于由数据库二维表来表现,包括所有格式的办公文档、XML、HTML、word文档,邮件,各类报表、图片和音频、视频信息等。其他的不同之处还有:结构化数据往往占用的空间较小,占企业数据的 20% 左右,容易管理。非结构化数据通常占用更多的存储空间,约占企业数据的 80% 左右,比较难以管理
到这里,为什么需要使用 ES 进行搜索的答案就很明确了:对于非结构化文本(比如评论内容),传统的结构化搜索难以满足需求,于是就会使用 ES 进行全文搜索。当然 ES 不仅可以进行全文搜索,也可以进行一部分的结构化搜索,更加扩大了他的应用范围。对于数据量巨大的情景,有公司会使用 ES 代替传统的 MySQL 管理数据。
本小结主要是介绍 ES 的一些基本概念,目的是方便之前没有了解过 ES 的同学可以理解这次分享所介绍的内容。
ES 在设计存储模型时,考虑了大家从关系型数据库转换肯能带来的困难,于是设计了 Index、Type、Document、Field 分别于对应传统关系型数据库(比如 MySQL) 的 Database、Table、Row、Column。注意: ES 存储时,并没有 Type 的概念,同一个Index 里的 Type 会拍平存储,只是方便理解才会对使用者提供这样一个抽象。由于Type 的存在会带来一些问题,在后续的版本里会逐步移除。
ES 底层基于 Lucene 开发,Lucene作为其核心来实现索引和搜索的功能。我们虽然讲的是 ES,但很大一部分内容是 Lucene 的实现。
中新网5月20日电 据国家卫健委网站消息,5月19日0—24时,31个省(自治区、直辖市)和新疆生产建设兵团报告新增确诊病例193例。其中境外
逛博物馆不需要理由,因为它本来就是生活的一部分 博物馆的力量 5月18日是国际博物馆日。今年国际博物馆日以“博物馆的力量”为
后视镜没折叠 成“拉门贼”下手目标 扬子晚报讯(记者 任国勇 通讯员 鼓公宣 魏山 张燕秋)近日,南京鼓楼公安分局小市派出所抓
中新网5月20日电 据四川省卫健委官方微信消息,5月19日0时至24时,四川新增本土确诊病例20例(在广安),新增本土无症状感染者102例(在
盲人女孩用琴键“追光” 多个钢琴比赛获奖,想当音乐老师教会更多人弹琴 家住苏州太仓的盲人女孩梅暄虽然双目失明,却一直坚持着自
X 关闭
X 关闭
四川广安市48小时内将新改建一个800张床位的方舱医院 记者从今日(19日)中午召开的广安市疫情防控发布会上获悉,广安市应急指挥部决[+更多]
河南:6月底前实现“场所码”全覆盖 “场所码”是流调的关键,是落实常态化疫情防控的重要举措。记者从河南省新冠肺炎疫情防控指挥[+更多]
中新网上海5月19日电 (陈静 朱虹 丁国莲)记者19日获悉,中国学者的最新研究解释,证实了糖尿病的卵母细胞起源,揭示了糖尿病代际遗[+更多]
中新社合肥5月19日电 题:虚拟人走红“Z世代”:未来虚拟人懂情感有温度 中新社记者 张俊 俏皮可爱的虚拟人形象、顺畅自然的肢[+更多]