好强的谷歌“Excel”,不用自己写代码就能爬虫,网友立马cue微软:慌不慌?

开发 新闻
一看到这是来自谷歌的“Excel”,大家就立马cue起了微软,问它慌不慌。

本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。

家人们,要爬虫——现在用一个电子表格就行了。

图片

一行代码也别写,第三方软件也甭安。

只需在表格里点几下就ok。

不信,你瞧:

就这么两下,网页上的商品信息都有了。

图片

网友看完都惊呆了,码个不停。

一看到这是来自谷歌的产品(Google Sheet,谷歌的“Excel”),大家就立马cue起了微软,问它慌不慌。

还有人称这是在“跨界打击”它。

图片

△ 扫盲:“巨硬”就是微软,网友给的调侃

好不热闹。

来看具体怎么实现。

详细步骤

以爬亚马逊某个手机产品的商品页为例。

我们先打开谷歌Sheet(网友版即可),新建一个文档。

然后copy一下要爬的网址,粘进去。

图片

剩下的都在Sheet里完成。

我们先列一下要爬的元素,这里依次为:

商品图片-识别码(asin,亚马逊给每个商品生成的唯一标识)-商品名-价格-评分-图片网址。

图片

然后就可以正式开始爬了。

要诀就是一个叫做ImportFromWeb的函数。

它也是个插件,没有的需要先安装一下(安装地址放文末了),然后通过Google Sheet程序的“扩展程序”菜单导入就行。

图片

我们只需把ImportFromWeb函数放进asin那一列,然后第一个参数选中刚刚粘过来的网址,第二个参数把要爬的元素单元格拖一遍(除了“图片”)

稍等个1~2s,价格、商品名等信息就都出来了!

图片

还差图片。

简单~基操~

用IMAGE函数把G3格子里得到的图片网址值给过去就行。

图片

至此,第一个商品页里的东西就爬到了。

唯一麻烦的是,如果还需要爬更多商品的信息,需要把商品网址挨个粘一遍。

然后就没啥了,除了给单元格地址的行标列标加一下绝对引用符“$”。

这里可以不学视频,直接一个f4就行。

拖一下,全部搞定!

图片

怎么样?是不是非常方便。

图片

看完整个操作,你也发现了,其实就是谷歌写了个脚本给咱封装好了直接用。

而据官方介绍,这个ImportFromWeb功能还能自动更新爬取到的信息。

而且只要是用JS写的网站都可以爬(基本等于绝大数网站了),每个函数还可支持50个url,以及数千个数据点。

快点起来吧~

责任编辑:张燕妮 来源: 量子位
相关推荐

2020-07-17 13:28:49

系统程序员开发

2023-03-07 07:43:07

微软ChatGPT工具

2021-03-08 10:17:58

开发技能代码

2021-11-01 09:19:51

谷歌技巧搜索工具

2023-03-26 12:32:33

ChatGPT机器人微软

2018-04-17 11:47:06

if代码参数

2023-02-20 09:45:32

技术AI

2020-12-08 06:20:00

Python自动化工具开源

2013-11-29 13:14:30

代码网页设计

2019-05-29 10:55:01

开源Linux发行版

2012-07-10 01:34:27

代码优化代码程序员

2022-01-28 18:49:10

微信红包封面

2023-01-26 00:52:14

ChatGPT福尔摩斯侦探小说

2020-10-29 15:17:49

代码开发工具

2021-02-09 10:07:23

面试MySQL存储

2019-04-09 11:24:20

存储

2022-11-11 10:01:35

代码Copilot函数

2022-02-08 22:18:10

Chrome插件服务器

2022-02-14 09:53:26

微软代码技术

2011-11-30 15:30:50

360手机防盗
点赞
收藏

51CTO技术栈公众号