人工智能专业主要学习哪些知识

新闻
随着当前人工智能技术的快速发展,行业领域对于人工智能人才的需求量也在不断增大,所以一部分高校也开始把人工智能人才培养从研究生教育阶段向本科教育阶段覆盖,相信在产业结构升级的推动下,未来人工智能人才的发展空间会非常大。

 很多程序员都不喜欢字符串,我也是,字符串处理起来太麻烦了,而且字符串也比较占空间。举个例子,一个字符要占1个字节,但一般常用字符就那么几个(例如我们常要求用户名只能是大小写字母与数字)。另外一个问题,就是数据库查询的时候,用字符串查询太不方便了。今天我们来了解下,数据库中的字符串查询问题。

[[321170]]

在PC互联网时代,我们的很多账户都需要绑定电子邮箱,我们偶尔需要使用电子邮箱,也就是字符串来进行数据查询,为了保证查询效率,我们通常要对字符串字段建立索引。

我们都知道,在InnoDB中,通常使用的是B+树索引,如果索引的类型是字符串,那么我们可能会面临这样一个问题,索引的长度会变得特别长,索引的长度过长会让索引的索引占用更多的存储空间,同时也会增加索引的维护成本。通常我们使用字符串索引,只会使用前面若干个字符,假如用户的邮箱的开头是26个字母,并且用户名随机均匀分布的,那么我们即使使用第一个字符做索引,也能减少25/26的扫描量,假如使用前2个字符,就可以减少675/676次扫描。所以,即便我们只用前面的若干个字符,也能大大地减少数据库的扫描,提升查询速度。

但是在现实生活中,用户名往往不是随机分布的,像a开头的用户往往占比较大。有些字符串的字段,往往开头是相似的,例如居民的身份证号,前面几位数通常是省份跟城镇,教育局的学生信息,通常id是入学时间加月份,索引的选择最好要满足唯一性,我们最好能使用更有特色的字段进行索引的建立。

例如身份证的问题,我们知道,身份证的前6位通常是地区信息,全国的省市区加起来也就是几千个,而身份证的后六位是生日的日信息跟4个随机数字。那么,仅有30万分之一的概率后六位的数字是相同的。也就是说,如果把身份证号码逆序存储后,取前6位作为索引,可以减少近百分的数据扫描量,从而大大提升扫描的效率。

另外一种方法,就是建立哈希索引而不是B+树索引,哈希索引的好处是在于查询特定字符串的时候,几乎都只要查询一行数据。但是哈希索引的弊端是不支持范围查询,也不支持字符串匹配,假如的业务没有这样的场景,那可以使用哈希索引。

好了,今天我们简单地介绍了Mysql数据库中,字符串索引的使用。不知道对你是否有所启发,欢迎大家关注我,共同学习,共同进步。

 

责任编辑:华轩 来源: 今日头条
相关推荐

2021-10-09 21:00:15

人工智能AI

2022-01-05 22:46:42

人工智能AI

2021-01-20 15:27:09

人工智能机器人科学

2021-05-20 14:54:36

人工智能机器人技术

2021-12-13 22:47:31

人工智能机器人学习

2020-09-28 15:19:47

计算机人工智能技术

2021-01-29 11:47:35

人工智能智能科学专业

2017-11-08 10:51:50

人工智能财经专业

2018-07-12 13:01:04

人工智能机器人机器学习

2018-03-26 15:02:21

人工智能应用领域专业知识

2017-07-19 13:08:27

人工智能机器学习深度学习

2017-07-21 12:52:32

人工智能机器学习神经网络

2021-04-27 09:30:32

人工智能AI

2018-07-04 14:36:15

2020-12-18 11:43:20

人工智能人工智能应用

2020-03-10 12:14:24

人工智能机器人AI

2024-01-11 16:58:30

人工智能AI软件测试

2021-08-02 09:58:40

人工智能AI机器学习

2015-10-10 09:32:24

机器学习人工智能

2023-10-30 08:00:24

点赞
收藏

51CTO技术栈公众号