谁说前端不需要懂二进制

开发 前端
本篇文章总结了浏览器端的二进制以及有关数据之间的转化,如 ArrayBuffer,TypedArray,Blob,DataURL,ObjectURL,Text 之间的互相转换。

作为一名前端,在工作中也会遇到很多有关二进制处理的需求,如 EXCEL 表格的导出,PDF 的生成,多个文件的打包,音频的处理。

从前后端整体上来说前端代表 UI 层,它的外在表现是 human readable 的,而服务端代表数据层,所表现出来的是 machine readable。如果 EXCEL 以及 PDF 的处理交由服务端处理,服务端免不了要做一层格式化的逻辑处理,以便与前端保持一致。一来增加了复杂度,二来容易造成前端与服务器端的数据不一致。此时为了减少复杂度,工作量有可能都尽可能在浏览器端完成。

本篇文章总结了浏览器端的二进制以及有关数据之间的转化,如 ArrayBuffer,TypedArray,Blob,DataURL,ObjectURL,Text 之间的互相转换。为了更好的理解与方便以后的查询,特意做了一张图做总结。

二进制相互转换图

二进制相关数据类型

在介绍常见的二进制数据处理之前,先简单介绍下几种二进制相关的数据类型

ArrayBuffer && TypedArray

TypedArray 是 ES6+ 新增的描述二进制数据的类数组数据结构。但它本身不可以被实例化,甚至无法访问,你可以把它理解为 Abstract Class 或者 Interface。而基于 TypedArray,有如下数据类型:

  •  Uint8ArrayUint 及 Unsigned Int 代表数组的每一项是无符号整型8 代表数据的每一项占 8 个比特位,即一个字节
  •  Int8Array
  •  Uint16Array
  •  Int16Array
  •  ...

通过 Uint8Array,即可知道 Uint16Array,Int8Array 所代表的意义。 

  1. const array = new Int32Array([1, 2, 3])  
  2. // .length 代表数组的大小  
  3. // 3  
  4. array.length   
  5. // .btyeLength 代表数据所占字节大小  
  6. // 12  
  7. array.byteLength 

ArrayBuffer 代表二进制数据结构,「并且只读」,需要转化为 TypedArray 进行写操作。 

  1. const array = new Int16Array([1, 2, 3])  
  2. // TypedArray -> ArrayBuffer  
  3. array.buffer  
  4. // ArrayBuffer -> TypedArray  
  5. new Int16Array(array.buffer)  
  6. // buffer.length 代表数据所占用字节大小  
  7. array.buffer.length === array.byteLength 

连接多个 TypedArray

TypedArray 没有像数组那样的 Array.prototype.concat 方法用来连接多个 TypedArray。不过它提供了 TypedArray.prototype.set 可以用来间接连接字符串

    ❝    可以参考 MDN 文档:https://developer.mozilla.org/en-US/docs/Web/JavaScript/Reference/Global_Objects/TypedArray/set    ❞ 

  1. // 在位移 offset 位置放置 typedarray  
  2. typedarray.set(typedarray, offset) 

原理就是先分配一块空间足以容纳需要连接的 TypedArray,然后逐一在对应位置叠加 

  1. function concatenate(constructor, ...arrays) {  
  2.   let length = 0 
  3.   for (let arr of arrays) {  
  4.     length += arr.length;  
  5.   }  
  6.   let result = new constructor(length);  
  7.   let offset = 0 
  8.   for (let arr of arrays) {  
  9.     result.set(arr, offset);  
  10.     offset += arr.length;  
  11.   }  
  12.   return result;  
  13.  
  14. concatenate(Uint8Array, new Uint8Array([1, 2, 3]), new Uint8Array([4, 5, 6])) 

同时您还需要对资源的获取有大致的了解,如 XHR,fetch,通过文件上传。

Blob

Blob 是浏览器端的类文件对象。操作 Blob 需要使用数据类型 FileReader。

FileReader 有以下方法,可以把 Blob 转化为其它数据

  •  FileReader.prototype.readAsArrayBuffer
  •  FileReader.prototype.readAsText
  •  FileReader.prototype.readAsDataURL
  •  FileReader.prototype.readAsBinaryString 
  1. const blob = new Blob('hello'.split(''))  
  2. // 表示文件的大小  
  3. blob.size  
  4. const array = new Uint8Array([128, 128, 128])  
  5. const blob2 = new Blob([array])  
  6. function readBlob (blob, type) {  
  7.   return new Promise(resolve => {  
  8.     const reader = new FileReader()  
  9.     reader.onload = function (e) {  
  10.       resolve(e.target.result)  
  11.     }  
  12.     reader.readAsArrayBuffer(blob)  
  13.   })  
  14.  
  15. readBlob(blob, 'DataURL').then(url => console.log(url)) 

数据输入

数据输入或者叫资源的请求可以分为以下两种途径

  •  通过 url 地址请求网络资源
  •  通过文件上传请求本地资源

fetch

fetch 应该是大家比较熟悉的,但大多使用环境比较单一,一般用来请求 json 数据。其实, 「它也可以设置返回数据格式为 Blob 或者 ArrayBuffer。」

fetch 返回一个包含 Response 对象的 Promise,Response 有以下方法

  •  Response.prototype.arrayBuffer
  •  Response.prototype.blob
  •  Response.prototype.text
  •  Response.prototype.json

    ❝    详情可以查看 MDN 文档 https://developer.mozilla.org/en-US/docs/Web/API/Response   ❞ 

  1. fetch('/api/ping').then(res => {  
  2.   // true  
  3.   console.log(res instanceof Response)  
  4.   // 最常见的使用  
  5.   return res.json() 
  6.   // 返回 Blob  
  7.   // return res.blob()  
  8.   // 返回 ArrayBuffer 
  9.   // return res.arrayBuffer()  
  10. }) 

另外,万能的 Response API 既可以可以使用 TypedArray,Blob,Text 作为输入,又可以使用它们作为输出。

「这意味着关于这三种数据类型的转换完全可以通过 Response」

xhr

「xhr 可以设置 responseType 接收合适的数据类型」 

  1. const request = new XMLHttpRequest()  
  2. request.responseType = 'arraybuffer'  
  3. request.responseType = 'blob' 

File

本地文件可以通过 input[type=file] 来上传文件。 

  1. <input type="file" id="input"> 

当上传成功后,可以通过 document.getElementById('input').files[0] 获取到上传的文件,即一个 File 对象,它是 Blob 的子类,可以通过 FileReader 或者 Response 获取文件内容。

数据输出

或者叫数据展示或者下载,数据经二进制处理后可以由 url 表示,然后通过 image, video 等元素引用或者直接下载。

Data URL

Data URL 即 Data As URL。所以, 「如果资源过大,地址便会很长。」 使用以下形式表示。 

  1. data:[<mediatype>][;base64],<data> 

先来一个 hello, world。把以下地址粘入地址栏,会访问到 hello, world 

  1. data:text/html,<h1>Hello%2C%20World!</h1> 

Base64 编码与解码

Base64 使用大小写字母,数字,+ 和 / 64 个字符来编码数据,所以称为 Base64。经编码后,文本体积会变大 1/3

在浏览器中,可以使用 atob 和 btoa 编码解码数据。 

  1. // aGVsbG8 
  2. btoa('hello') 

Object URL

可以使用浏览器新的 API URL 对象生成一个地址来表示 Blob 数据。 

  1. // 粘贴生成的地址,可以访问到 hello, world  
  2. // blob:http://host/27254c37-db7a-4f2f-8861-0cf9aec89a64  
  3. URL.createObjectURL(new Blob('hello, world'.split(''))) 

下载

data:application/octet-stream;base64,5bGx5pyI

资源的下载可以利用 FileSaver[1] 。

这里也简单写一个函数,用来下载一个链接 

  1. function download (url, name) {  
  2.   const a = document.createElement('a')  
  3.   a.download = name  
  4.   a.rel = 'noopener'  
  5.   a.href = url  
  6.   // 触发模拟点击  
  7.   a.dispatchEvent(new MouseEvent('click'))  
  8.   // 或者 a.click(  

二进制数据转换

二进制数据转换

 

以上是二进制数据间的转换图,有一些转换可以直接通过 API,有些则需要代码,以下贴几种常见转换的代码

String to TypedArray

根据上图,由字符串到 TypedArray 的转换,可以通过 「String -> Blob -> ArrayBuffer -> TypedArray」 的途径。

关于代码中的函数 readBlob 可以回翻环节 数据类型 - Blob[2] 

  1. const name = '山月'  
  2. const blob = new Blob(name.split(''))  
  3. readBlob(blob, 'ArrayBuffer').then(buffer => new Uint8Array(buffer)) 

也可以通过 Response API 直接转换 「String -> ArrayBuffer -> TypedArray」 

  1. const name = '山月'  
  2. new Response(name).arrayBuffer(buffer => new Uint8Array(buffer)) 

这上边两种方法都是直接通过 API 来转化,如果你更像了解如何手动转换一个字符串和二进制的 TypedArray

String to TypedArray 2

使用 enodeURIComponent 把字符串转化为 utf8,再进行构造 TypedArray。 

  1. function stringToTypedArray(s) {  
  2.   const str = encodeURIComponent(s)  
  3.   const binstr = str.replace(/%([0-9A-F]{2})/g, (_, p1) => {  
  4.     return String.fromCharCode('0x' + p1)  
  5.   })  
  6.   return new Uint8Array(binstr.split('').map(x => x.charCodeAt(0)))  

实践

1. 如何上传本地图片并在网页上展示

由以上整理的转换图得出途径

本地上传图片 -> Blob -> Object URL

2. 如何拼接两个音频文件

由以上整理的转换图得出途径

fetch请求音频资源 -> ArrayBuffer -> TypedArray -> 拼接成一个 TypedArray -> ArrayBuffer -> Blob -> Object URL

3. 如何把 json 数据转化为 demo.json 并下载文件

json 视为字符串,由以上整理的转换图得出途径

Text -> DataURL

除了使用 DataURL,还可以转化为 Object URL 进行下载。关于下载的函数 download,可以参考以上环节 数据输出-下载[3]

Text -> Blob -> Object URL

可以把以下代码直接粘贴到控制台下载文件 

  1. const json = {  
  2.   a: 3,  
  3.   b: 4,  
  4.   c: 5  
  5.  
  6. const str = JSON.stringify(json, null, 2)  
  7. // 方案一:Text -> DataURL  
  8. const dataUrl = `data:,${str}`  
  9. download(dataUrl, 'demo.json')  
  10. // 方案二:Text -> Blob -> ObjectURL  
  11. const url = URL.createObjectURL(new Blob(str.split('')))  
  12. download(url, 'demo1.json')  

 

责任编辑:庞桂玉 来源: 前端大全
相关推荐

2009-11-23 12:45:22

2015-08-20 10:56:19

算法界面开发

2021-10-26 00:12:13

前端算法思路

2022-09-14 15:10:40

前端架构

2022-02-15 07:26:34

web前端算法题

2018-10-22 14:37:16

二进制数据存储

2009-02-27 09:37:33

Google二进制代码

2022-10-31 08:02:42

二进制计算乘法

2019-09-11 15:29:08

工程师浏览器软件

2017-03-13 13:54:40

戴尔

2010-06-09 13:02:29

MySQL启用二进制日

2009-08-12 18:06:53

C#读取二进制文件

2010-10-13 15:45:23

MySQL二进制日志

2021-04-08 08:06:03

二进制补码计算编码和计算

2012-08-23 09:50:07

测试测试人员软件测试

2017-04-11 10:48:53

JS二进制

2009-12-16 10:49:42

Ruby操作二进制文件

2022-07-26 13:00:01

安全符号源代码

2009-12-10 09:24:50

PHP函数fwrite

2023-09-18 23:50:25

二进制文件裁剪Layout
点赞
收藏

51CTO技术栈公众号