用 JavaScript 读取 Excel 文件

Sahil Bhosale 2024年2月15日
  1. 安装 xlsx Node.js 包
  2. 用 JavaScript 读取 Excel 文件
用 JavaScript 读取 Excel 文件

有时我们想从 excel 文件中读取和解析数据,并将其转换为 JSON 格式以在我们的网页上使用。我们可以通过各种方式做到这一点。

本文将讨论使用 JavaScript 中的 xlsx 包读取 excel 文件。

在本例中,我们将使用一个名为 ss.xls 的 Excel 文件,该文件将包含两个工作表 Sheet1 和 Sheet2,其中包含一些数据,如下图所示。

Excel 表格示例

安装 xlsx Node.js 包

要安装 xlsx 包,你可以运行以下命令。确保你的系统上安装了 Node.js

如果不确定是否安装了 Node.js,可以在终端中使用 node -v 命令。如果你获得版本号作为输出,则 Node.js 已安装在你的系统上。

命令:

npm install xlsx

你可以使用此库解析具有 .xlsxlsx 扩展名的 excel 文件。 .xls 是以二进制格式存储数据的旧文件格式,而 .xlsx 是最新的文件格式,它以 ZIP 格式将数据存储在压缩的 XML 文件中。

用 JavaScript 读取 Excel 文件

安装包后,我们首先必须在我们的 Node.js 项目中导入包,即在 index.js 文件中。现在,我们将创建一个函数 parseExcel(),它将一个文件 filename 作为参数并返回一个对象数组。

现在我们有了 excel filename,我们可以使用 XLSX 包的 readFile 函数从该文件中读取和提取所有信息。然后,我们将结果存储在 excelData 变量中。

excelData 变量现在包含与 Excel 文件相关的所有信息,如作者姓名、修改数据、工作表数、文件数据等。

要获取有关存储在与 excel 文件相关的 excelData 变量中的数据的更多信息,你可以使用 console.log() 函数打印该变量。

代码片段:

const XLSX = require('xlsx');

const parseExcel = (filename) => {
  const excelData = XLSX.readFile(filename);

  return Object.keys(excelData.Sheets).map(name => ({
                                             name,
                                             data: XLSX.utils.sheet_to_json(
                                                 excelData.Sheets[name]),
                                           }));
};

parseExcel('./ss.xls').forEach(element => {
  console.log(element.data);
});

excelData 变量现在包含一个名为 Sheets 的对象。这个对象有一个对象集合; Sheets 中的每个对象都代表一个 Excel 文件的工作表。

要解析 excel 文件中存在的所有工作表中的数据,我们将使用 excelData.Sheets 对象。

代码片段:

Sheets: {
  Sheet1: {'!ref': 'A1:D7', A1: [Object], B1: [Object], '!margins': [Object]},
  Sheet2: {'!ref': 'A1:C3', A1: [Object], B1: [Object], '!margins': [Object]}
},

由于 excelData.Sheets 对象内部包含各种对象,如上所示,我们将使用 Object.key() 功能。

现在,我们将使用 map() 函数并将 name 作为从 Object.keys() 获得的参数传递给 map() 函数。使用 map() 函数,我们将返回一个对象,该对象将包含 Excel 工作表的两个属性 name 和 Excel 工作表包含的 data

在这里,我们已经有了名称,可以直接将名称存储在对象中。但是要从 excelData 变量中获取数据,我们必须使用 XLSX.utils 提供的 sheet_to_json() 函数。

正如你在上面的代码片段中看到的,我们从文件中获取的数据是 A1: [Object] 格式,但我们需要解析这些数据。

我们将使用 sheet_to_json() 函数将 Excel 工作表中的数据转换为 JSON 格式。然后,我们将此数据存储在对象 data 的第二个属性中。

你可以为 data 属性指定任何名称。

因此,在这个阶段,如果你通过提供文件路径作为参数来运行 parseExcel() 函数,这将返回一个数组,该数组将包含所有 Excel 工作表及其对象形式的各自数据。

代码片段:

[{
  name: 'Sheet1',
  data: [[Object], [Object], [Object], [Object], [Object], [Object]]
},
 {name: 'Sheet2', data: [[Object], [Object]]}]

现在,为了只获取所有 Excel 工作表的数据而不是名称,我们可以使用 forEach 循环遍历 parseExcel() 函数返回的数组。我们将在每次迭代时获取一个对象并将其存储在 element 变量中。

使用点符号,我们可以访问该对象 element.data 的数据属性,然后在控制台上打印它。

输出:

xls 文件的输出数据

作者: Sahil Bhosale
Sahil Bhosale avatar Sahil Bhosale avatar

Sahil is a full-stack developer who loves to build software. He likes to share his knowledge by writing technical articles and helping clients by working with them as freelance software engineer and technical writer on Upwork.

LinkedIn

相关文章 - JavaScript Excel