Как разобрать файл Excel в Javascript / HTML5


136

Я могу читать файл Excel, FileReaderно он выводит текст, а также странные символы. Мне нужно читать xlsфайл по строкам, читать данные в каждом столбце и преобразовывать их в JSON.

Как читать xls файл построчно?



1
@JoachimPileborg: это не ответ на вопрос. Мне нужно читать файл Excel по строкам. Хотя я могу читать его с помощью FileReader (HTML5), но все еще не могу просматривать строки.
ducktyped

Ответы:


105

Функция ниже преобразует данные листа Excel (формат XLSX) в JSON. вы можете добавить обещание к функции.

<script src="https://cdnjs.cloudflare.com/ajax/libs/xlsx/0.8.0/jszip.js"></script>
<script src="https://cdnjs.cloudflare.com/ajax/libs/xlsx/0.8.0/xlsx.js"></script>
<script>
var ExcelToJSON = function() {

  this.parseExcel = function(file) {
    var reader = new FileReader();

    reader.onload = function(e) {
      var data = e.target.result;
      var workbook = XLSX.read(data, {
        type: 'binary'
      });

      workbook.SheetNames.forEach(function(sheetName) {
        // Here is your object
        var XL_row_object = XLSX.utils.sheet_to_row_object_array(workbook.Sheets[sheetName]);
        var json_object = JSON.stringify(XL_row_object);
        console.log(json_object);

      })

    };

    reader.onerror = function(ex) {
      console.log(ex);
    };

    reader.readAsBinaryString(file);
  };
};
</script>

Ниже в сообщении есть код для формата XLS Excel в код JSON javascript?


1
он вылетает из-за больших файлов Excel в Chrome, какое-нибудь хорошее решение для этого?
Зед

Могу я узнать, насколько больше у вас файл?
Перу

6
e.target.result () должен быть e.target.result см. developer.mozilla.org/en-US/docs/Web/API/FileReader/onload
user227353

3
Раньше мне приходилось декларировать jszip.jsсценарий xlsx.js.
Флорин Вирдол

1
Как я могу назначить json_object общедоступной переменной и получить к ней доступ вне цикла for?
Шардул

109

Старый вопрос, но я должен отметить, что общая задача синтаксического анализа файлов XLS из javascript утомительна и сложна, но не невозможна.

У меня есть базовые парсеры, реализованные на чистом JS:

Обе страницы являются синтаксическими анализаторами XLS / XLSX, управляемыми API файлов HTML5 (вы можете перетащить файл, и он распечатает данные в ячейках в списке, разделенном запятыми). Вы также можете создавать объекты JSON (при условии, что первая строка является строкой заголовка).

Набор тестов http://oss.sheetjs.com/ показывает версию, которая использует XHR для получения и анализа файлов.


4
Если бы вы могли добавить к ответу образец кода, он бы стал намного лучше (также добавьте заявление об ответственности, если вы лидер библиотек).
acdcjunior

3
Я писал об этом в блоге psjinx.com/programming/2014/01/04/… :)
pankaj28843 04

можем ли мы пропустить несколько верхних строк и столбцов xlsx с помощью JS-XLSX?
mayank

19

Загрузите excel fileсюда, и вы сможете получить данные в JSONформате console:

<script src="https://ajax.googleapis.com/ajax/libs/jquery/2.1.1/jquery.min.js"></script>
<script src="https://cdnjs.cloudflare.com/ajax/libs/xlsx/0.8.0/jszip.js"></script>
<script src="https://cdnjs.cloudflare.com/ajax/libs/xlsx/0.8.0/xlsx.js"></script>
<script>
    var ExcelToJSON = function() {

      this.parseExcel = function(file) {
        var reader = new FileReader();

        reader.onload = function(e) {
          var data = e.target.result;
          var workbook = XLSX.read(data, {
            type: 'binary'
          });
          workbook.SheetNames.forEach(function(sheetName) {
            // Here is your object
            var XL_row_object = XLSX.utils.sheet_to_row_object_array(workbook.Sheets[sheetName]);
            var json_object = JSON.stringify(XL_row_object);
            console.log(JSON.parse(json_object));
            jQuery( '#xlx_json' ).val( json_object );
          })
        };

        reader.onerror = function(ex) {
          console.log(ex);
        };

        reader.readAsBinaryString(file);
      };
  };

  function handleFileSelect(evt) {
    
    var files = evt.target.files; // FileList object
    var xl2json = new ExcelToJSON();
    xl2json.parseExcel(files[0]);
  }


 
</script>

<form enctype="multipart/form-data">
    <input id="upload" type=file  name="files[]">
</form>

    <textarea class="form-control" rows=35 cols=120 id="xlx_json"></textarea>

    <script>
        document.getElementById('upload').addEventListener('change', handleFileSelect, false);

    </script>

Это комбинация следующих Stackoverflowпостов:

  1. https://stackoverflow.com/a/37083658/4742733
  2. https://stackoverflow.com/a/39515846/4742733

Удачи...


14

Этот код может вам помочь. В
большинстве случаев jszip.js не работает, поэтому включите xlsx.full.min.js в свой js-код.

HTML-код

 <input type="file" id="file" ng-model="csvFile"  
    onchange="angular.element(this).scope().ExcelExport(event)"/>

Javascript

<script src="https://cdnjs.cloudflare.com/ajax/libs/xlsx/0.8.0/xlsx.js">
</script>
<script src="https://cdnjs.cloudflare.com/ajax/libs/xlsx/0.8.0/jszip.js">
</script>
<script src="https://cdnjs.cloudflare.com/ajax/libs/xlsx/0.10.8/xlsx.full.min.js">
</script>

$scope.ExcelExport= function (event) {


    var input = event.target;
    var reader = new FileReader();
    reader.onload = function(){
        var fileData = reader.result;
        var wb = XLSX.read(fileData, {type : 'binary'});

        wb.SheetNames.forEach(function(sheetName){
        var rowObj =XLSX.utils.sheet_to_row_object_array(wb.Sheets[sheetName]);
        var jsonObj = JSON.stringify(rowObj);
        console.log(jsonObj)
        })
    };
    reader.readAsBinaryString(input.files[0]);
    };

А как насчет того, если я захочу загрузить изображения также в лист Excel
Маюр Агарвал

9

Если вам нужен самый простой и крошечный способ чтения файла * .xlsx в браузере, эта библиотека может:

https://catamphetamine.github.io/read-excel-file/

<input type="file" id="input" />
import readXlsxFile from 'read-excel-file'

const input = document.getElementById('input')

input.addEventListener('change', () => {
  readXlsxFile(input.files[0]).then((data) => {
    // `data` is an array of rows
    // each row being an array of cells.
  })
})

В приведенном выше примере dataэто необработанные строковые данные. Его можно преобразовать в JSON со строгой схемой, передав schemaаргумент. См. Пример в документации API.

Документация по API: http://npmjs.com/package/read-excel-file


4

Спасибо за ответ выше, я думаю, что объем (ответов) завершен, но я хотел бы добавить «способ реагирования» для тех, кто использует реакцию.

Создайте файл с именем importData.js:

import React, {Component} from 'react';
import XLSX from 'xlsx';
export default class ImportData extends Component{
    constructor(props){
        super(props);
        this.state={
            excelData:{}
        }
    }
    excelToJson(reader){
        var fileData = reader.result;
        var wb = XLSX.read(fileData, {type : 'binary'});
        var data = {};
        wb.SheetNames.forEach(function(sheetName){
             var rowObj =XLSX.utils.sheet_to_row_object_array(wb.Sheets[sheetName]);
             var rowString = JSON.stringify(rowObj);
             data[sheetName] = rowString;
        });
        this.setState({excelData: data});
    }
    loadFileXLSX(event){
        var input = event.target;
        var reader = new FileReader();
        reader.onload = this.excelToJson.bind(this,reader);
        reader.readAsBinaryString(input.files[0]);
    }
    render(){
        return (
            <input type="file" onChange={this.loadFileXLSX.bind(this)}/>
        );
    }
}

Затем вы можете использовать компонент в методе рендеринга, например:

import ImportData from './importData.js';
import React, {Component} from 'react';
class ParentComponent extends Component{
    render(){
        return (<importData/>);
    }
}

<ImportData/>будет устанавливать данные в своей собственной стране, вы можете получить доступ к данным Excel в «родительский компонент», следуя этим :


Я думаю, что тег в операторе возврата должен быть <ImportData/>вместо <importData/>. Я новичок в React, но считаю, что имена компонентов всегда пишутся с заглавной буквы. В любом случае это имя используется при импорте в примере.
rhaben

3

<script src="https://ajax.googleapis.com/ajax/libs/jquery/2.1.1/jquery.min.js"></script>
<script src="https://cdnjs.cloudflare.com/ajax/libs/xlsx/0.8.0/jszip.js"></script>
<script src="https://cdnjs.cloudflare.com/ajax/libs/xlsx/0.8.0/xlsx.js"></script>
<script>
    var ExcelToJSON = function() {

      this.parseExcel = function(file) {
        var reader = new FileReader();

        reader.onload = function(e) {
          var data = e.target.result;
          var workbook = XLSX.read(data, {
            type: 'binary'
          });
          workbook.SheetNames.forEach(function(sheetName) {
            // Here is your object
            var XL_row_object = XLSX.utils.sheet_to_row_object_array(workbook.Sheets[sheetName]);
            var json_object = JSON.stringify(XL_row_object);
            console.log(JSON.parse(json_object));
            jQuery( '#xlx_json' ).val( json_object );
          })
        };

        reader.onerror = function(ex) {
          console.log(ex);
        };

        reader.readAsBinaryString(file);
      };
  };

  function handleFileSelect(evt) {
    
    var files = evt.target.files; // FileList object
    var xl2json = new ExcelToJSON();
    xl2json.parseExcel(files[0]);
  }


 
</script>

<form enctype="multipart/form-data">
    <input id="upload" type=file  name="files[]">
</form>

    <textarea class="form-control" rows=35 cols=120 id="xlx_json"></textarea>

    <script>
        document.getElementById('upload').addEventListener('change', handleFileSelect, false);

    </script>


0

Если вы когда-нибудь задумывались, как прочитать файл с сервера, этот код может быть полезен.

Ограничения:

  1. Файл должен находиться на сервере (локальном / удаленном).
  2. Вам нужно будет настроить заголовки или установить плагин CORS google.

<Head>
    <script src="https://ajax.googleapis.com/ajax/libs/jquery/1.12.4/jquery.min.js"></script>
    <script lang="javascript" src="https://cdnjs.cloudflare.com/ajax/libs/xlsx/0.12.4/xlsx.core.min.js"></script>
</head>

<body>
    <script>
    /* set up XMLHttpRequest */


    // replace it with your file path in local server
    var url = "http://localhost/test.xlsx";

    var oReq = new XMLHttpRequest();
    oReq.open("GET", url, true);
    oReq.responseType = "arraybuffer";

    oReq.onload = function(e) {
        var arraybuffer = oReq.response;

        /* convert data to binary string */
        var data = new Uint8Array(arraybuffer);

        var arr = new Array();
        for (var i = 0; i != data.length; ++i) {
            arr[i] = String.fromCharCode(data[i]);
        }

        var bstr = arr.join("");

        var cfb = XLSX.read(bstr, { type: 'binary' });

        cfb.SheetNames.forEach(function(sheetName, index) {

            // Obtain The Current Row As CSV
            var fieldsObjs = XLS.utils.sheet_to_json(cfb.Sheets[sheetName]);

            fieldsObjs.map(function(field) {
                $("#my_file_output").append('<input type="checkbox" value="' + field.Fields + '">' + field.Fields + '<br>');
            });

        });
    }

    oReq.send();
    </script>
</body>
<div id="my_file_output">
</div>

</html>

0

включить xslx.js, xlsx.full.min.js, jszip.js

добавить обработчик события onchange к вводу файла

function showDataExcel(event)
{
            var file = event.target.files[0];
            var reader = new FileReader();
            var excelData = [];
            reader.onload = function (event) {
                var data = event.target.result;
                var workbook = XLSX.read(data, {
                    type: 'binary'
                });

                workbook.SheetNames.forEach(function (sheetName) {
                    // Here is your object
                    var XL_row_object = XLSX.utils.sheet_to_row_object_array(workbook.Sheets[sheetName]);

                    for (var i = 0; i < XL_row_object.length; i++)
                    {
                        excelData.push(XL_row_object[i]["your column name"]);

                    }

                    var json_object = JSON.stringify(XL_row_object);
                    console.log(json_object);
                    alert(excelData);
                })

            };

            reader.onerror = function (ex) {
                console.log(ex);
            };

            reader.readAsBinaryString(file);

}

-4

XLS - это закрытый двоичный формат, используемый Microsoft. Разбор XLS с языками на стороне сервера очень сложен без использования какой-либо конкретной библиотеки или Office Interop. Сделать это с помощью javascript невозможно. Благодаря API файлов HTML5 вы можете читать его двоичное содержимое, но для его анализа и интерпретации вам нужно будет погрузиться в спецификации формата XLS . Начиная с Office 2007, Microsoft приняла форматы файлов Open XML ( xslxдля Excel), которые являются стандартом.


@ducktyped, я не знаю и не видел кода javascript, который читает двоичный файл Excel.
Дарин Димитров

13
Задание невыполнимо? Я сомневаюсь в этом. Если мы сможем запустить ядро ​​Linux в клиентском javascript, тогда появится возможность анализировать двоичный файл Excel. Просто, насколько мне известно, этого еще никто не делал.
JP Richardson

Вот документация для любопытной структуры ms xls msdn.microsoft.com/en-us/library/office/…
djra

-5

var excel = новый ActiveXObject ("Excel.Application"); var book = excel.Workbooks.Open (your_full_file_name_here.xls); var sheet = book.Sheets.Item (1); значение var = sheet.Range ("A1");

когда у вас есть лист. Вы можете использовать функции VBA, как в Excel.


6
это работает только с IE "наш дорогой друг". И мне нужно использовать HTML5. Мне просто нужно просматривать фактическое текстовое содержимое строка за строкой.
ducktyped
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.