目前项目中采用的是POI 的方式实现导入导出。下面这段话是踩自EasyExcel官方文档。
Java解析、生成Excel比较有名的框架有Apache poi、jxl。但他们都存在一个严重的问题就是非常的耗内存,poi有一套SAX模式的API可以一定程度的解决一些内存溢出的问题,但POI还是有一些缺陷,比如07版Excel解压缩以及解压后存储都是在内存中完成的,内存消耗依然很大。
easyexcel重写了poi对07版Excel的解析,一个3M的excel用POI sax解析依然需要100M左右内存,改用easyexcel可以降低到几M,并且再大的excel也不会出现内存溢出;03版依赖POI的sax模式,在上层做了模型转换的封装,让使用者更加简单方便
com.alibaba easyexcel 3.1.1
/*** @author itender* @date 2023/1/30 17:30* @desc*/
@Data
@Builder
@AllArgsConstructor
@NoArgsConstructor
// 类上加注解 @ExcelIgnoreUnannotated,过滤属性没有@ExcelProperty注解的字段
@ExcelIgnoreUnannotated
public class User {/*** user id.*/@ExcelProperty("ID")private Long id;/*** 姓名.*/@ExcelProperty("姓名")private String userName;/*** 性别.*/@ExcelProperty("性别")private String gender;/*** 地址.*/@ExcelProperty("地址")private String address;/*** 邮箱.*/@ExcelProperty("邮箱")private String email;/*** 手机号码.*/@ExcelProperty("手机号码")private Long phoneNumber;/*** 描述.*/@ExcelIgnore@ExcelProperty("描述")private String description;
}
@GetMapping("/export")
public void exportUserInfo(HttpServletResponse response) {try {response.reset();response.setContentType("application/vnd.ms-excel");response.setCharacterEncoding(StandardCharsets.UTF_8.name());String fileName = "导出用户信息列表";// 注意:这里要加上filename*=utf-8'zh_cn'否则可能会导致导出文件名乱码response.setHeader("Content-disposition","attachment;filename*=utf-8'zh_cn'" + fileName + System.currentTimeMillis() + ".xlsx");userService.exportUserInfo(response.getOutputStream());} catch (IOException e) {e.printStackTrace();}
}@PostMapping("/import")
public void importUserInfo(@RequestParam(value = "file") MultipartFile file) {try {userService.importUserInfo(file.getInputStream());} catch (IOException e) {e.printStackTrace();}
}
/*** @author itender* @date 2023/1/30 17:43* @desc*/
public interface UserService {/*** 导出文件** @param outputStream*/void exportUserInfo(ServletOutputStream outputStream);/*** 导入文件** @param inputStream*/void importUserInfo(InputStream inputStream);
}
/*** @author itender* @date 2023/1/30 17:43* @desc*/
@Slf4j
@Service
public class UserServiceImpl implements UserService {@Overridepublic void exportUserInfo(ServletOutputStream outputStream) {// 第一种方式ExcelWriter excelWriter = EasyExcelFactory.write(outputStream).build();WriteSheet userSheet = EasyExcelFactory.writerSheet(0).head(User.class)// 导出文件需不包含的列名.excludeColumnFieldNames(Lists.newArrayList())// 导出文件包含的列名.includeColumnFieldNames(Lists.newArrayList()).build();excelWriter.write(this::getUserList, userSheet);excelWriter.finish();// 第二种方式EasyExcelFactory.write(outputStream, User.class).sheet("userInfo").doWrite(this::getUserList);}private List getUserList() {return Collections.singletonList(User.builder().id(1L).userName("itender").gender("男").address("广东深圳").email("itender@163.com").phoneNumber(13156777777L).description("hello world").build());}@Overridepublic void importUserInfo(InputStream inputStream) {// 第一种方式ExcelDataListener excelDataListener = new ExcelDataListener();ExcelReader excelReader = EasyExcelFactory.read(inputStream).build();ReadSheet userSheet = EasyExcelFactory.readSheet(0).head(User.class).registerReadListener(excelDataListener).build();excelReader.read(userSheet);// 第二种方式EasyExcelFactory.read(inputStream, User.class, new ReadListener() {/*** 每隔5条存储数据库,实际使用中可以100条,然后清理list ,方便内存回收*/private static final int BATCH_COUNT = 100;/*** 缓存的数据*/private final List cachedDataList = ListUtils.newArrayListWithExpectedSize(BATCH_COUNT);@Overridepublic void invoke(User user, AnalysisContext analysisContext) {cachedDataList.add(user);}@Overridepublic void doAfterAllAnalysed(AnalysisContext analysisContext) {cachedDataList.forEach(user -> log.info(user.toString()));}}).sheet().doRead();// 拿到错误信息,返回前端String errorMsg = excelDataListener.getErrorMsg();}
}
/*** @author itender* @date 2023/1/31 12:21* @desc*/
@Slf4j
public class ExcelDataListener implements ReadListener {/*** 每隔5条存储数据库,实际使用中可以100条,然后清理list ,方便内存回收*/private static final int BATCH_COUNT = 100;/*** 缓存的数据*/private static final List CACHED_DATA_LIST = ListUtils.newArrayListWithExpectedSize(BATCH_COUNT);/*** 错误信息*/@Getterprivate String errorMsg;/*** 这个每一条数据解析都会来调用** @param user* @param analysisContext*/@Overridepublic void invoke(User user, AnalysisContext analysisContext) {log.info("解析到一条数据:{}", JSONUtil.toJsonStr(user));// TODO 校验导入数据是否合规// 如果不合规this.errorMsg = StrFormatter.format("导入数据第{}行校验不通过!", analysisContext.readRowHolder().getRowIndex());CACHED_DATA_LIST.add(user);// 达到BATCH_COUNT了,需要去存储一次数据库,防止数据几万条数据在内存,容易OOMif (CACHED_DATA_LIST.size() >= BATCH_COUNT) {// TODO 保存数据到MySQL// 存储完成置空listCACHED_DATA_LIST.clear();}}/*** 所有数据解析完成了 都会来调用** @param analysisContext*/@Overridepublic void doAfterAllAnalysed(AnalysisContext analysisContext) {// 这里也要保存数据,确保最后遗留的数据也存储到数据库// TODO 保存数据到MySQLlog.info("所有数据解析完成!");}
}
参考:
在很多场景下,Excel的列与实体类可能并不完全一致,这时就需要排除一些实体类的字段。
方式一:类上加注解 @ExcelIgnoreUnannotated,过滤属性没有@ExcelProperty注解的字段
方式二:指定字段加@ExcelIgnore注解
方式三:代码指定过滤字段,通过excludeColumnFiledNames方法:
防止导出文件名乱码:
response.setHeader(“Content-disposition”,
“attachment;filename*=utf-8’zh_cn’” + fileName + System.currentTimeMillis() + “.xlsx”);
可以自定义Listener监听器实现导入数据校验,避免一次性导入太多数据,最好数据分批入库。
本文介绍了EasyExcel的使用,整体而言操作简单、使用方便,提供了不少注解,方便与实体对象之间的关系绑定。而且官网也提供了相关的性能数据,更多的API使用大家还可以继续探索。
无论从性能或易用性上来说,都值得你尝试。特别是临时写一个Excel的解析或生成的工具,再也不用惆怅一行行的解析了,赶紧收藏用起来吧。