ECMAScript 2024(ES15)将带来这些新特性,超实用!

开发 前端
在JavaScript的正则表达式中,u 标志表示“Unicode”模式。当你在正则表达式中使用这个标志时,它会将模式视为Unicode序列的集合,而不仅仅是一组ASCII字符。这意味着正则表达式会正确地处理四个字节的UTF-16编码。

ECMAScript 语言规范每年都会进行一次更新,而备受期待的 ECMAScript 2024 将于 2024 年 6 月正式亮相。目前,ECMAScript 2024 的候选版本已经发布,为我们带来了一系列实用的新功能。接下来,就让我们一起先睹为快吧!

全文概览:

  • Promise.withResolvers
  • Object.groupBy / Map.groupBy
  • ArrayBuffer.prototype.resize
  • ArrayBuffer.prototype.transfer
  • String.prototype.isWellFormed
  • String.prototype.toWellFormed
  • Atomics.waitAsync
  • 正则表达式 v 标志

Promise.withResolvers()

Promise.withResolvers() 允许创建一个新的 Promise,并同时获得 resolve 和 reject 函数。这在某些场景下非常有用,特别是当需要同时访问到 Promise 的 resolve 和 reject 函数时。

Promise.withResolvers() 完全等同于以下代码:

let resolve, reject;
const promise = new Promise((res, rej) => {
  resolve = res;
  reject = rej;
});

通常,当创建一个新的 Promise 时,会传递一个执行器函数给 Promise 构造函数,这个执行器函数接收两个参数:resolve 和 reject 函数。但在某些情况下,可能想要在 Promise 创建之后仍然能够访问到这两个函数。这就是 Promise.withResolvers() 的用武之地。

使用 Promise.withResolvers() 的一个例子:

const { promise, resolve, reject } = Promise.withResolvers();  
  
// 在这里可以使用 resolve 和 reject 函数  
setTimeout(() => resolve('成功!'), 1000);  
  
promise.then(value => {  
  console.log(value); // 输出: 成功!  
});

在这个例子中,首先通过 Promise.withResolvers() 创建了一个新的 Promise,并同时获得了 resolve 和 reject 函数。然后,在 setTimeout 回调中使用 resolve 函数来解析这个 Promise。最后,添加了一个 .then 处理程序来处理 Promise 解析后的值。

使用 Promise.withResolvers() 关键的区别在于解决和拒绝函数现在与 Promise 本身处于同一作用域,而不是在执行器中被创建和一次性使用。这可能使得一些更高级的用例成为可能,例如在重复事件中重用它们,特别是在处理流和队列时。这通常也意味着相比在执行器内包装大量逻辑,嵌套会更少。

这个功能对于那些需要更细粒度控制 Promise 的状态,或者在 Promise 创建后仍然需要访问 resolve 和 reject 函数的场景来说非常有用。

Object.groupBy / Map.groupBy

Object.groupBy 和 Map.groupBy 方法用于数组分组。

假设有一个由表示人员的对象组成的数组,需要按照年龄进行分组。可以使用forEach循环来实现,代码如下:

const people = [
  { name: "Alice", age: 28 },
  { name: "Bob", age: 30 },
  { name: "Eve", age: 28 },
];

const peopleByAge = {};

people.forEach((person) => {
  const age = person.age;
  if (!peopleByAge[age]) {
    peopleByAge[age] = [];
  }
  peopleByAge[age].push(person);
});

console.log(peopleByAge);

输出结果如下:

{
  "28": [{"name":"Alice","age":28}, {"name":"Eve","age":28}],
    "30": [{"name":"Bob","age":30}]
}

也可以使用reduce方法:

const peopleByAge = people.reduce((acc, person) => {
  const age = person.age;
  if (!acc[age]) {
    acc[age] = [];
  }
  acc[age].push(person);
  return acc;
}, {});

无论哪种方式,代码都略显繁琐。每次都要检查对象,看分组键是否存在,如果不存在,则创建一个空数组,并将项目添加到该数组中。

使用 Object.groupBy 分组

可以通过以下方式来使用新的Object.groupBy方法:

const peopleByAge = Object.groupBy(people, (person) => person.age);

可以看到,代码非常简洁!

不过需要注意,使用Object.groupBy方法返回一个没有原型(即没有继承任何属性和方法)的对象。这意味着该对象不会继承Object.prototype上的任何属性或方法,例如hasOwnProperty或toString等。虽然这样做可以避免意外覆盖Object.prototype上的属性,但也意味着不能使用一些与对象相关的方法。

const peopleByAge = Object.groupBy(people, (person) => person.age);
console.log(peopleByAge.hasOwnProperty("28"));
// TypeError: peopleByAge.hasOwnProperty is not a function

在调用Object.groupBy时,传递给它的回调函数应该返回一个字符串或 Symbol 类型的值。如果回调函数返回其他类型的值,它将被强制转换为字符串。

在这个例子中,回调函数返回的是一个数字类型的age属性值,但由于Object.groupBy方法要求键必须是字符串或 Symbol 类型,所以该数字会被强制转换为字符串类型。

console.log(peopleByAge[28]);
// => [{"name":"Alice","age":28}, {"name":"Eve","age":28}]
console.log(peopleByAge["28"]);
// => [{"name":"Alice","age":28}, {"name":"Eve","age":28}]

使用 Map.groupBy 分组

Map.groupBy和Object.groupBy几乎做的是相同的事情,只是返回的结果类型不同。Map.groupBy返回一个Map对象,而不是像Object.groupBy返回一个普通的对象。

const ceo = { name: "Jamie", age: 40, reportsTo: null };
const manager = { name: "Alice", age: 28, reportsTo: ceo };

const people = [
  ceo
  manager,
  { name: "Bob", age: 30, reportsTo: manager },
  { name: "Eve", age: 28, reportsTo: ceo },
  ];

const peopleByManager = Map.groupBy(people, (person) => person.reportsTo);

这里根据人的汇报上级将他们进行了分组。如果想通过对象来从这个Map中获取数据,那么要求这些对象具有相同的身份或引用。这是因为Map在比较键时使用的是严格相等(===),只有两个对象具有相同的引用,才能被认为是相同的键。

peopleByManager.get(ceo);
// => [{ name: "Alice", age: 28, reportsTo: ceo }, { name: "Eve", age: 28, reportsTo: ceo }]
peopleByManager.get({ name: "Jamie", age: 40, reportsTo: null });
// => undefined

在上面的例子中,如果尝试使用与ceo对象类似的对象作为键去访问Map中的项,由于这个对象与之前存储在Map中的ceo对象不是同一个对象,所以无法检索到对应的值。

ArrayBuffer.prototype.resize

ArrayBuffer 实例的 resize() 方法将 ArrayBuffer 调整为指定的大小,以字节为单位,前提是该 ArrayBuffer 是可调整大小的并且新的大小小于或等于该 ArrayBuffer 的 maxByteLength。

const buffer = new ArrayBuffer(8, { maxByteLength: 16 });

console.log(buffer.byteLength);
// 8

if (buffer.resizable) {
  console.log("缓冲区大小是可调整的!");
  buffer.resize(12);
}

注意:

  • 如果 ArrayBuffer 已分离或不可调整大小,则抛出该错误。
  • 如果 newLength 大于该 ArrayBuffer 的 maxByteLength,则抛出该错误。

ArrayBuffer.prototype.transfer

transfer() 方法执行与结构化克隆算法相同的操作。它将当前 ArrayBuffer 的字节复制到一个新的 ArrayBuffer 对象中,然后分离当前 ArrayBuffer 对象,保留了当前 ArrayBuffer 的大小可调整性。

// 创建一个 ArrayBuffer 并写入一些字节
const buffer = new ArrayBuffer(8);
const view = new Uint8Array(buffer);
view[1] = 2;
view[7] = 4;

// 将缓冲区复制到另一个相同大小的缓冲区
const buffer2 = buffer.transfer();
console.log(buffer.detached); // true
console.log(buffer2.byteLength); // 8
const view2 = new Uint8Array(buffer2);
console.log(view2[1]); // 2
console.log(view2[7]); // 4

// 将缓冲区复制到一个更小的缓冲区
const buffer3 = buffer2.transfer(4);
console.log(buffer3.byteLength); // 4
const view3 = new Uint8Array(buffer3);
console.log(view3[1]); // 2
console.log(view3[7]); // undefined

// 将缓冲区复制到一个更大的缓冲区
const buffer4 = buffer3.transfer(8);
console.log(buffer4.byteLength); // 8
const view4 = new Uint8Array(buffer4);
console.log(view4[1]); // 2
console.log(view4[7]); // 0

// 已经分离,抛出 TypeError
buffer.transfer(); // TypeError: Cannot perform ArrayBuffer.prototype.transfer on a detached ArrayBuffer

String.prototype.isWellFormed()

isWellFormed() 方法返回一个表示该字符串是否包含单独代理项的布尔值。

JavaScript 中的字符串是 UTF-16 编码的。UTF-16 编码中的代理对是指:

在UTF-16编码中,代理对(Surrogate Pair)是一种特殊的编码机制,用于表示那些超出基本多文种平面(BMP)的Unicode字符。这些字符的Unicode码点高于U+FFFF,因此无法用一个16位的UTF-16码元来表示。为了解决这个问题,UTF-16引入了代理对机制。


代理对是由两个16位的码元组成的,一个称为高代理(或高代理码元),其码点范围在U+D800到U+DBFF之间;另一个称为低代理(或低代理码元),其码点范围在U+DC00到U+DFFF之间。这两个码元合在一起,可以表示一个超出BMP的Unicode字符。


例如,Unicode码点U+10000(这是BMP之外的第一个码点)在UTF-16中的编码就是高代理码元U+D800和低代理码元U+DC00的组合,即“D800 DC00”。同样,码点U+10001的UTF-16编码就是“D800 DC01”,以此类推。


通过这种方式,UTF-16编码能够完全表示所有Unicode字符,无论是BMP内的还是BMP外的。这种代理对机制是UTF-16编码方案的一个重要组成部分,使得UTF-16成为一种能够灵活处理各种语言字符的编码方式。

isWellFormed() 让你能够测试一个字符串是否是格式正确的(即不包含单独代理项)。由于引擎能够直接访问字符串的内部表示,与自定义实现相比 isWellFormed() 更高效。如果需要将字符串转换为格式正确的字符串,可以使用 toWellFormed() 方法。isWellFormed() 让你可以对格式正确和格式错误的字符串进行不同的处理,比如抛出一个错误或将其标记为无效。

const strings = [
  // 单独的前导代理
  "ab\uD800",
  "ab\uD800c",
  // 单独的后尾代理
  "\uDFFFab",
  "c\uDFFFab",
  // 格式正确
  "abc",
  "ab\uD83D\uDE04c",
];

for (const str of strings) {
  console.log(str.isWellFormed());
}
// 输出:
// false
// false
// false
// false
// true
// true

如果传递的字符串格式不正确, encodeURI 会抛出错误。可以通过使用 isWellFormed() 在将字符串传递给 encodeURI() 之前测试字符串来避免这种情况。

const illFormed = "https://example.com/search?q=\uD800";

try {
  encodeURI(illFormed);
} catch (e) {
  console.log(e); // URIError: URI malformed
}

if (illFormed.isWellFormed()) {
  console.log(encodeURI(illFormed));
} else {
  console.warn("Ill-formed strings encountered."); // Ill-formed strings encountered.
}

String.prototype.toWellFormed()

toWellFormed() 方法返回一个字符串,其中该字符串的所有单独代理项都被替换为 Unicode 替换字符 U+FFFD。

toWellFormed() 迭代字符串的码元,并将任何单独代理项替换为 Unicode 替换字符 U+FFFD。这确保了返回的字符串格式正确并可用于期望正确格式字符串的函数,比如 encodeURI。由于引擎能够直接访问字符串的内部表示,与自定义实现相比 toWellFormed() 更高效。

const strings = [
  // 单独的前导代理
  "ab\uD800",
  "ab\uD800c",
  // 单独的后尾代理
  "\uDFFFab",
  "c\uDFFFab",
  // 格式正确
  "abc",
  "ab\uD83D\uDE04c",
];

for (const str of strings) {
  console.log(str.toWellFormed());
}
// Logs:
// "ab�"
// "ab�c"
// "�ab"
// "c�ab"
// "abc"
// "ab😄c"

如果传递的字符串格式不正确, encodeURI 会抛出错误。可以先通过使用 toWellFormed() 将字符串转换为格式正确的字符串来避免这种情况。

const illFormed = "https://example.com/search?q=\uD800";

try {
  encodeURI(illFormed);
} catch (e) {
  console.log(e); // URIError: URI malformed
}

console.log(encodeURI(illFormed.toWellFormed())); // "https://example.com/search?q=%EF%BF%BD"

Atomics.waitAsync()

Atomics.waitAsync() 静态方法异步等待共享内存的特定位置并返回一个 Promise。与 Atomics.wait() 不同,waitAsync 是非阻塞的且可用于主线程。

下面来看一个简单的例子,给定一个共享的 Int32Array。

const sab = new SharedArrayBuffer(1024);
const int32 = new Int32Array(sab);

令一个读取线程休眠并在位置 0 处等待,预期该位置的值为 0。result.value 将是一个 promise。

const result = Atomics.waitAsync(int32, 0, 0, 1000);
// { async: true, value: Promise {<pending>} }

在该读取线程或另一个线程中,对内存位置 0 调用以令该 promise 解决为 "ok"。

Atomics.notify(int32, 0);
// { async: true, value: Promise {<fulfilled>: 'ok'} }

如果它没有解决为 "ok",则共享内存该位置的值不符合预期(value 将是 "not-equal" 而不是一个 promise)或已经超时(该 promise 将解决为 "time-out")。

正则表达式 v 标志

RegExp v 标志是 u 标志的超集,并提供了另外两个功能:

  • 字符串的 Unicode 属性: 通过 Unicode 属性转义,可以使用字符串的属性。
const re = /^\p{RGI_Emoji}$/v;

// 匹配仅包含 1 个代码点的表情符号:
re.test('⚽'); // '\u26BD'
// → true ✅

// 匹配由多个代码点组成的表情符号:
re.test('👨🏾⚕️'); // '\u{1F468}\u{1F3FE}\u200D\u2695\uFE0F'
// → true ✅
  • 设置符号: 允许在字符类之间进行集合操作。
const re = /[\p{White_Space}&&\p{ASCII}]/v;
re.test('\n'); // → true
re.test('\u2028'); // → false

在JavaScript的正则表达式中,u 标志表示“Unicode”模式。当你在正则表达式中使用这个标志时,它会将模式视为Unicode序列的集合,而不仅仅是一组ASCII字符。这意味着正则表达式会正确地处理四个字节的UTF-16编码。


具体来说,u 标志有以下几个作用:

正确处理Unicode字符:不使用 u 标志时,正则表达式可能无法正确处理Unicode字符,尤其是那些超出基本多文种平面(BMP)的字符。使用 u 标志后,你可以匹配和处理任何有效的Unicode字符。

改变量词的行为:在Unicode模式下,量词(如 *、+、?、{n}、{n,}、{n,m})会匹配任何有效的Unicode字符,而不仅仅是ASCII字符。

允许使用\p{...} 和 \P{...}:这两个是Unicode属性转义,允许匹配或不匹配具有特定Unicode属性的字符。例如,\p{Script=Arabic} 会匹配任何阿拉伯脚本的字符。

正确处理Unicode转义:在Unicode模式下,你可以使用 \u{...} 来表示一个Unicode字符,其中 {...} 是一个四位的十六进制数。

修正了某些正则表达式方法的行为:例如,String.prototype.match()、String.prototype.replace()、String.prototype.search() 和 RegExp.prototype.exec() 等方法在Unicode模式下会返回更准确的结果。

责任编辑:姜华 来源: 前端充电宝
相关推荐

2021-08-02 23:12:04

iOS苹果系统

2016-03-14 15:43:31

GCC新特性

2023-01-05 08:00:24

RegExpFoo类字段

2021-02-22 11:51:15

Java开发代码

2022-06-24 08:33:13

ECMAScriptjavaScript

2023-06-28 00:40:01

ECMAScriptWeakMapSymbol

2020-08-31 08:11:01

V8 8.5Promise前端

2021-03-05 18:38:45

ESvue项目

2023-05-22 16:03:00

Javascript开发前端

2012-03-02 11:35:12

微软Windows 8

2023-04-19 15:26:52

JavaScriptES13开发

2013-09-09 13:48:53

SDN

2011-05-26 10:27:37

Fedora 15

2020-11-25 08:15:20

数字货币区块链比特币

2020-07-01 07:58:20

ES6JavaScript开发

2012-02-21 22:31:09

Windows 8

2016-12-23 21:15:03

大数据思维模式变化

2019-03-04 09:39:41

Java开发代码

2023-11-23 10:21:11

ECMAScriptJavaScript

2023-01-31 07:36:25

JavaScript数组缓冲
点赞
收藏

51CTO技术栈公众号