news 2026/4/23 1:37:26

ES 新手入门:10分钟搞定项目集成与基础使用

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
ES 新手入门:10分钟搞定项目集成与基础使用
    • 第一步:本地起一个 ES
    • 第二步:Java 项目引入依赖
    • 第三步:定义一个实体类
    • 第四步:写个 Repository
    • 第五步:试试写入和查询
    • 遇到的问题 & 小技巧
    • 最后说两句

最近我们团队开始在新项目里用 Elasticsearch(简称 ES),主要是为了做订单和用户的模糊搜索。以前用数据库 LIKE 查询,慢得要死,特别是数据量一大,用户搜个名字都卡半天。后来老大说:“试试 ES 吧,搞不好真香。” 我就硬着头皮上手了,结果发现——真的没那么难

这篇文章就是我踩坑后整理的“人话版”入门指南,不讲原理,只讲怎么快速跑起来。目标是:10 分钟内,让你的 Java 项目能往 ES 里写数据、也能查出来


第一步:本地起一个 ES

别一上来就想着集群、分片、副本。先本地跑起来再说。

我用的是 Docker,一行命令搞定:

docker run -d --name es -p9200:9200 -p9300:9300 -e"discovery.type=single-node"docker.elastic.co/elasticsearch/elasticsearch:8.12.0

注意:ES 8 默认开启安全认证,对新手不太友好。如果你只是本地测试,可以加个环境变量关掉:

-e"xpack.security.enabled=false"

跑起来后,浏览器访问http://localhost:9200,看到一堆 JSON 信息,说明 OK 了。


第二步:Java 项目引入依赖

我们用的是 Spring Boot,所以直接加 starter:

<dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-data-elasticsearch</artifactId></dependency>

然后在application.yml里配一下地址:

spring:elasticsearch:uris:http://localhost:9200

如果你关了安全认证,这样就行。如果开了,还得配用户名密码,但新手建议先关掉,省事。


第三步:定义一个实体类

假设我们要存“用户”信息,比如 ID、姓名、手机号、邮箱。

@Document(indexName="user")publicclassUser{@IdprivateStringid;privateStringname;privateStringphone;privateStringemail;// getter / setter 省略}

这里关键就两行:

  • @Document(indexName = "user"):告诉 ES,这个类对应 ES 里的user索引(你可以理解成“表”)。
  • @Id:主键,ES 会用它做文档 ID。

我们的经验是:字段名尽量用英文小写,别用下划线,避免映射出问题。


第四步:写个 Repository

Spring Data 给我们提供了超简单的操作方式:

publicinterfaceUserRepositoryextendsElasticsearchRepository<User,String>{// 按名字模糊搜List<User>findByNameContaining(Stringname);}

就这一行!继承ElasticsearchRepository,泛型填你的实体类和 ID 类型,CRUD 方法都有了。

那个findByNameContaining是 Spring Data 的命名规则,意思是“名字包含 xxx”。ES 会自动转成全文检索,不用写查询语句。


第五步:试试写入和查询

写个测试方法:

@SpringBootTestclassEsTest{@AutowiredprivateUserRepositoryuserRepository;@TestvoidsaveUser(){Useruser=newUser();user.setId("1");user.setName("张三");user.setPhone("13800138000");user.setEmail("zhangsan@example.com");userRepository.save(user);}@TestvoidsearchUser(){List<User>users=userRepository.findByNameContaining("张");users.forEach(System.out::println);}}

先跑saveUser(),再跑searchUser(),控制台应该能打出“张三”。

我认为:这比写 SQL 简单多了,尤其是模糊匹配,数据库要加%还可能走不到索引,ES 天然支持。


遇到的问题 & 小技巧

  1. 索引没自动创建?
    Spring Data 默认会在第一次 save 时自动建索引。但如果字段类型复杂(比如嵌套对象),可能需要手动建 mapping。新手先用简单字段,基本没问题。

  2. 中文搜不准?
    默认的分词器对中文不友好。比如搜“张三”,可能拆成“张”和“三”,但如果你搜“张三丰”,可能就匹配不上。
    我们的做法是:先用默认的跑通流程,等业务稳定了再单独处理中文分词(比如集成 ik 分词器)。别一上来就想完美,容易劝退。

  3. ID 到底用啥?
    我们一般用业务主键(比如用户 ID 字符串),而不是让 ES 自动生成。这样方便和数据库对齐。


最后说两句

ES 确实强大,但新手最容易犯的错就是“想一口吃成胖子”——又是调分片,又是搞高亮,又是聚合分析……结果连最基础的增删改查都没跑通。

在我看来,先让它跑起来,能用就行。等真遇到性能问题或功能瓶颈,再深入优化。大部分中小项目,用默认配置 + 简单查询,已经能解决 90% 的搜索需求了。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 18:49:19

打卡信奥刷题(2554)用C++实现信奥 P2133 天作之合

P2133 天作之合 题目背景 生活就是一次 A*&#xff0c;你是我的第一个目标状态。——小明 题目描述 在小明的学校中&#xff0c;有若干个女生。小明认为每个女生的特征可以抽象为一个 666 位的数字串&#xff0c;其中不重复地包含 1∼61\sim61∼6 这 666 个数码。 在小明心中&a…

作者头像 李华
网站建设 2026/4/23 9:59:57

Kotaemon插件架构揭秘:轻松集成外部API和业务逻辑

Kotaemon插件架构揭秘&#xff1a;轻松集成外部API和业务逻辑 在企业级AI应用日益复杂的今天&#xff0c;一个智能对话系统是否“好用”&#xff0c;早已不再仅仅取决于它背后的语言模型有多强大。真正决定成败的&#xff0c;往往是那些看不见的工程细节&#xff1a;能否快速接…

作者头像 李华
网站建设 2026/4/21 21:07:18

Triple Removal Maximum Array 2

两场算法竞赛C题通关手记&#xff1a;最近刷竞赛题时遇到两道很有意思的C题&#xff0c;分别是Triple Removal和Maximum Array 2。一道考的是前缀和加二分的区间查询技巧&#xff0c;另一道则是围绕MEX和区间最小值展开的构造题&#xff0c;琢磨透这两道题的过程里&#xff0c;…

作者头像 李华
网站建设 2026/4/18 13:06:08

48、多线程编程全面解析

多线程编程全面解析 1. 计算机性能发展与多线程需求 在2004年之前,提升计算机性能主要依靠提高单个处理器的能力。然而,如今的硅微芯片技术受物理限制,使得单个处理器性能难以进一步提升,计算能力与散热的阈值趋于稳定,甚至出现了性能停滞和小幅度下降的情况。 尽管如此…

作者头像 李华
网站建设 2026/4/21 21:13:41

53、多线程编程中的同步、存储与异步模式解析

多线程编程中的同步、存储与异步模式解析 在多线程编程领域,存在着诸多复杂的问题和有效的解决方案。下面将详细介绍线程本地存储、定时器以及异步编程模型等关键内容。 线程本地存储 在某些情况下,使用同步锁会导致性能下降和可扩展性受限,或者对特定数据元素进行同步操…

作者头像 李华
网站建设 2026/4/23 9:52:15

9、量子力学原理与量子计算机:从理论到实践

量子力学原理与量子计算机:从理论到实践 量子力学基础 测量后的状态描述 在量子力学中,为了预测测量后的状态,我们会对初始状态向量进行改写。对于一个有 (n + 1) 个自由度的系统,初始状态向量 (|\psi\rangle_{n + 1}) 可以表示为: [|\psi\rangle_{n + 1} = \sqrt{p(0…

作者头像 李华