FastDFS文件名策略及对小文件的优化

运维 系统运维
FastDFS是一个应用级分布式文件存储服务,其采用中心型结构(类似GFS、HDFS、TFS等),主要用于大中型网站存储资源文件。FastDFS具有轻量级,支持高并发放访问,负载均衡,可扩展等优点。而FastDFS最大的亮点就是对小文件的存储性能较好,这主要来自于其文件名策略。

FastDFS是一个应用级分布式文件存储服务,其采用中心型结构(类似GFS、HDFS、TFS等),主要用于大中型网站存储资源文件。FastDFS具有轻量级,支持高并发放访问,负载均衡,可扩展等优点。而FastDFS最大的亮点就是对小文件的存储性能较好,这主要来自于其文件名策略。

1.小文件存储性能优化

小文件的性能瓶颈主要来自于对元数据服务器(如FastDFS中的TrackerServer或TFS中的NameServer)的访问,因为当文件本身大小很小时,元数据存储所占空间与文件内容存储所占空间的比例就变得较大,访问元数据所消耗资源与访问文件内容所消耗资源的比例也变得较大。因此,通常对小文件存储的优化方法主要有两大类思路:一是减少访问元数据的次数,比如Cache预取;二是减少元数据所占的存储空间,比如FastDFS使用的文件名策略。

2. FastDFS文件名策略

FastDFS中的文件名是在向StorageServer存储文件时由系统指定的,文件名中包含了VolumeID和FileID。也就是说,当客户要读取某个文件时,通过在客户端对文件名进行解析,就可以知道该文件存储在哪个Volume上和它在StorageServer中的FileID。但是此时用户还不能读取文件,因为他不知道Volume内各个StorageServer的ip地址,也不知道应该从Volume内的哪个StorageServer中读取。所以用户需手持欲访问的文件的VolumeID向TrackerServer询问,TrackerServe会均衡当前各StorageServer的IO负载状况,返回一个最佳的StorageServer的ip地址。最后用户与该StorageServer连接,出示欲访问文件的FileID,StorageServer上会维持一个FileID对应偏移量的表,从而得到欲访问文件的偏移量。

可见,FastDFS的文件名策略将文件存储位置信息隐含在文件名中,从而减少了元数据量,达到了优化小文件存储性能的作用。

责任编辑:黄丹 来源: csdn博客
相关推荐

2009-06-29 09:57:05

Unix

2022-04-21 09:26:41

FastDFS开源分布式文件系统

2012-12-24 15:00:56

sis塞班

2020-08-13 14:58:06

Spark小文件存储

2021-03-16 12:42:42

FreeDOS开源

2009-11-02 11:13:06

VB.NET读写文件

2022-09-28 08:18:01

I/ONIO2API

2022-12-01 08:30:15

API调用系统

2009-03-11 09:28:18

文件名乱码下载浏览器PHP

2009-10-24 10:38:34

2010-01-14 10:07:08

VB.NET文件名排序

2013-03-11 14:42:08

Hadoop

2022-11-10 15:17:43

Windows文件Linux

2012-10-11 14:03:56

FastDFS分布式文件系统

2021-06-28 11:30:39

PythonWindows反斜杠

2009-10-27 10:58:00

VB.NET文件名排序

2010-06-23 16:14:52

Linux Bash

2020-11-05 14:28:07

Shell脚本SQL

2010-10-29 13:37:17

2018-03-28 17:51:24

LinuxUnix
点赞
收藏

51CTO技术栈公众号