社区编辑申请
注册/登录
自然语言处理在如何改变数据分析界 译文
大数据 数据分析 自然语言处理
随着NLP变得更普遍,它将使人们能够以前所未有的方式与计算机进行交互。这种新型协作将改善广泛的人类活动,包括商业、慈善、健康和沟通。

【51CTO.com快译】

自然语言处理(NLP)是计算机理解和处理人类自然语言的过程。如果您使用谷歌搜索、Alex、Siri或谷歌助理,想必已看到其功效。NLP的优点在于,它让用户无需先转换成“计算机语言”就可以进行查询。

NLP有望使企业应用和消费级应用都更易于使用。软件开发人员已经将其集成到比以往更多的应用中,包括机器翻译、语音识别、情感分析、聊天机器人、市场情报、文本分类和拼写检查等。

这项技术在数据分析界来得特别有用,可以分析数据以帮助企业负责人、研究人员及其他人员获得有助于他们做出高效决策的洞察力。正如下文所介绍,NLP可以从多方面支持数据分析工作,比如解决重大的全球性问题,以及帮助更多的人(甚至数据处理方面未受过培训的人)使用这些系统。

管理大数据

在NLP的帮助下,用户可以分析比以往更多的数据,包括医学研究等关键过程。由于研究人员试图寻找新冠病毒疫苗,这项技术现在尤为重要。

世界经济论坛组织(WEF)在最近的一篇文章中指出,NLP可以通过研究分析人类无法分析的大量数据来帮助研究人员应对新冠疫情。“机器可以找到、评估和总结成千上万篇有关新冠病毒的研究论文,论文每周增加数千篇……”。此外,这项技术还可以通过检测新的爆发来帮助跟踪病毒的传播。

据WEF的文章显示,当数据分析员“[训练]机器以分析完整句子的用户问题,然后阅读数据库中成千上万篇学术文章,对文章进行排名,并生成答案片段和摘要,NLP就可以辅助研究过程。”比如说,研究人员可能会提出“新冠病毒是不是季节性病毒?”这种问题。系统会检查数据并给出相关响应。

解决问题

除了紧迫的健康问题外,与人工智能(AI)结合使用的NLP还可以帮助专业人员克服其他全球性挑战,比如清洁能源、全球饥饿、改善教育和自然灾害。比如说,据《福布斯》刊文,“像谷歌这样的大公司正将目光投向防洪、利用AI预先确定有风险的方面,并通知受影响地区的人们。”

支持更多的专业人员

据《信息周刊》杂志的文章报道:“凭借自然语言搜索功能,用户不必了解SQL或布尔搜索,因此搜索起来变得更容易。”由于洞察力的质量取决于知道如何“提出正确的问题”,这项技能可能很快对企业运营人员、经理和行政人员来说变得至关重要。

比如说,公司内的任何人都可以使用NLP,提出此类问题:“上一个财年的库存周转率与本财年相比如何?”,从而查询商业智能(BI)系统。系统会将每个短语转换成数字信息,搜索所需的数据,然后以自然语言的格式返回。这类查询使任何部门的任何员工都可以获得重要的洞察力,以帮助他们做出明智的决定。

打造数据驱动型文化

过去,数据分析支持的商业智能(BI)需要训练有素的数据专业人员来正确输入查询并解读结果。但NLP改变了这种情况,导致一些专家所谓的“数据民主化”:更多人能够访问以前仅留给拥有解读数据集所需的高级技能的那些人的数据集。

公司内知道如何基于数据获取洞察力的人越多,公司从数据驱动型文化中获得的好处就越大,这种文化依赖可靠的证据,而不是依赖猜测、观察或理论来做出决策。这种文化可以在任何行业中加以培养,包括医疗保健、制造、金融、零售或物流等行业。

比如说,零售营销经理可能希望确定每次购买花费最多的客户的人口统计数据,利用特殊优惠或忠诚度奖励来牢牢吸引那些客户。制造业的轮班负责人可能希望测试其运营部门的不同方法,确定哪种方法的效率最高。使用NLP,获取这种信息所需的命令可以由企业中的任何人来执行。

总结

NLP尚未普及开来。据《信息周刊》的那篇文章报道,“少数几家BI和分析供应商在提供NLP功能,但它们目前占少数。更多的供应商可能很快会进入市场,以保持竞争力。”

随着NLP变得更普遍,它将使人们能够以前所未有的方式与计算机进行交互。这种新型协作将改善广泛的人类活动,包括商业、慈善、健康和沟通。

随着计算机学会识别上下文,甚至学会识别肢体语言和面部表情等非语言性人类线索,这些进步将变得更有用。换句话说,与计算机对话可能会继续变得越来越像人类。

原文标题:How Natural Language Processing Is Changing Data Analytics,作者:Malcom Ridgers

 

【51CTO译稿,合作站点转载请注明原文译者和出处为51CTO.com】

责任编辑:华轩 来源: 51CTO
相关推荐

2022-06-05 21:09:47

Python办公自动化

2022-06-28 22:13:33

Polars数据处理与分析

2022-06-15 08:25:07

Python天气数据可视化分析

2022-06-15 11:02:40

网络安全运营

2022-06-29 09:19:09

静态代码C语言c代码

2022-06-30 18:17:00

数据集云数据建模计数据仓库

2022-06-30 09:07:52

2022-06-13 08:00:00

数据湖数据仓库大数据

2022-06-17 18:49:25

pythonexcel

2022-05-19 19:26:33

区块链大数据数据分析

2022-06-21 10:04:25

数据中心智慧城市

2022-06-24 10:16:59

Python精选库

2022-05-24 09:52:37

Spark SQL大数据处理Hive

2022-06-23 12:43:36

区块链加密货币

2022-06-17 09:21:53

Pandas代码透视表

2022-06-27 08:07:13

Go语言互斥锁

2022-04-28 18:37:50

PythonExcel

2022-03-29 14:49:14

大数据数据分析

2022-05-25 14:10:51

学术数据

2022-07-03 06:10:15

同话题下的热门内容

七个好用常见的大数据分析模型Apache Doris刚刚 "毕业":这个SQL数据仓库有什么不一样?数据指标 VS 标签体系,到底有啥区别?终于讲清楚了!一文看懂:数据指标体系的四大类型大变局!全国房价,跌破万元大关

编辑推荐

什么是数据分析的漏斗模型?数据分析师还吃香吗?用数据告诉你对比解读五种主流大数据架构的数据分析能力《狄仁杰之四大天王》影评分析(爬虫+词云+热力图)22个免费的数据可视化和分析工具推荐
我收藏的内容
点赞
收藏

51CTO技术栈公众号