Unix系统被塞满的清理策略

系统 其他OS
在文章中,我们会对Unix系统的知识进行下介绍。一旦遇到某个分区被塞满,后果也许会十分糟糕。导致某个守护进程不能写入磁盘而异常终止。

在我们对Unix系统的学习中,我们有很多要学的知识。尽管现在的磁盘容量越来越大,但它终究有被塞满的可能,如果遇上粗枝大叶的系统管理员,磁盘被塞满的时间将变得更短。

一个Unix系统/linux运行环境,一旦遇到某个分区(也称文件系统)被塞满,后果也许会十分糟糕—我曾有过在凌晨2点起来干活的经历—分区/tmp满了,导致某个守护进程不能写入磁盘而异常终止。想必其他人也有类似的情况,怎样处理和避免这样的麻烦呢?这里有些意见供大家参考。

先谈非技术方面的因素,简单的讲就是规章制度。Linux/Unix系统大多是公共服务器,应该禁止上传与工作无关的私人数据。某君买了一个NAS(网络附属存储)设备,4个73G的硬盘,本来打算做web的后台数据存储,但是,但是….后来据我所知,这个大容量磁盘不到2个月所剩空间不到20G,私下浏览,嘿!大部分数据是他私人的,他本来就有收藏废品的嗜好,难怪呢。因此在这个方面,制度应该严厉一些,避免同事放垃圾数据在公共空间。

磁盘上的数据可能随时增长,任何人不可能24小时盯着它,因此实现自动化监控手段是十分必要的,对于更大规模的网络环境,这也许是唯一的途径。下面是一个用perl写的监控磁盘容量的脚本(大宇对此有贡献):
 

  1. #!/usr/bin/perl -w  
  2. # this program will check disk capacity $full and send the warning message  
  3. # to $email_address  
  4. # (set the threshold to 90 and check it in the daytime so no paging  
  5. # is needed)  
  6. my $email_address = 'sa@yourcom.com';  
  7. my $hostname = `/sbin/ifconfig -a|grep inet|head -1|cut -f2 -d":"|cut -f1 -d" "`;  
  8. my $dmesg = `dmesg`;  
  9. chomp(my $now = `date +"%x %X"`);  
  10. my $full = 90; # the threshold to send the warning  
  11. my $warn = 95;  
  12. my $count = 0;  
  13. my ($dev,$total,$used);  
  14. my @df_messages = `df|grep -v proc`;  
  15. print @df_messages;  
  16. shift(@df_messages);  
  17. foreach $message (@df_messages) {  
  18. chomp($message);  
  19. ($dev, $total, $used, $available, $capacity, $mount) = split(/\s+/, $message);  
  20. $capacity =~ s/(\d+)\%/$1/;  
  21. if ($capacity > $full) {  
  22. $available[$count] = $available;  
  23. $capacity[$count] = $capacity;  
  24. $mount[$count] = $mount;  
  25. ++$count;  
  26. $email_address = 'sa@yourcom.com' if ($capacity > $warn);  
  27. }  
  28. }  
  29. if ($count > 0) {  
  30. open(MAIL, "|/usr/sbin/sendmail -t");  
  31. print MAIL "To: $email_address \n";  
  32. print MAIL "Subject: Disk almost full on $hostname ($now)\n";  
  33. print MAIL "\n";  
  34. for ($i = 0; $i < $count; ++$i) {  
  35. print MAIL "There are only $available[$i] KB ($capacity[$i]\% full) left on $mount[$i] \n";  
  36. }  
  37. }  
  38. if ( $dmesg =~ m/ERROR/ )  
  39. {  
  40. open(EMAIL, "|/usr/sbin/sendmail -t") or die "Can't fork for sendmail: $!\n";  
  41. print EMAIL <<_EOF_ ;  
  42. To: $email_address  
  43. subject: HARDWARE error on $hostname!!!  
  44. $hostname needs to be checked right now!  
  45. .  
  46. _EOF_  
  47. close("EMAIL");  

把这个脚本放在定时任务crontab里即可实现自动监控,只要某个分区的容量达到脚本中阀值,系统就会发送报警邮件到管理员信箱,更进一步还可设定发送手机短信报警。

知道某个分区快要被塞满的情况后,接下来的事情就是清理它了。登陆Unix系统,然后使用命令df –h察看具体的磁盘使用情况(老一点版本的solaris不支持选项-h,请用-k这个选项),

磁盘的利用率是以百分比的方式显示的,非常直观。找到快要被塞满的分区之后,应该先着手查找占用空间大的***的文件,然后处理这个占用空间***的文件。这里我用一个实例(根分区/root)来演示这个过程。

1、进入目录/root,执行命令 du –h | sort –n 就把当前目录下目录以及文件所占的大小按顺序排列出来了,一屏显示不完的话再用加一个管道 du –h | sort –n | more 就好了。
 

  1. -bash-3.00# du -h | sort -n| more  
  2. 1K   ./.dt/appmanager  
  3. 1K   ./.dt/help  
  4. 1K   ./.dt/icons  
  5. 1K   ./.dt/tmp  
  6. ……….(省略若干行)  
  7. 914K   ./mysql-5.0.37/zlib  
  8. 933K   ./mysql-5.0.37/ndb/src/kernel/blocks/dblqh  
  9. 938K   ./mysql-5.0.37/scripts  
  10. 945M   .           //这个东西占太大的空间  
  11. 957K   ./mysql-5.0.37/extra/yassl/taocrypt  
  12. 959K   ./vsftpd-2.0.5  
  13. 1002K   ./mysql-5.0.37/ndb/src/common  
  14. -bash-3.00# 

有上面的输出,我们可以知道在当前目录里有大文件,但是看不出是哪个文件。

2、再执行命令 ls –al | grep ^- |more 就可以看见每个文件的大小。
 

  1. -bash-3.00#       ls -al | grep ^-|more  
  2. -rw-------   1 root   root       810 Apr 29 09:59 .ICEauthority  
  3. -rw-------   1 root   root       98 Apr 29 09:59 .Xauthority  
  4. -rw-------   1 root   root       730 Apr 30 07:52 .bash_history  
  5. -rwxr-xr-x   1 root   root     5111 Apr 29 08:30 .dtprofile  
  6. -rw-r--r--   1 root   root       81 Apr 29 08:30 .gtkrc-1.2-gnome2  
  7. -rw-------   1 root   root       0 Apr 29 08:30 .recently-used  
  8. -rw-r--r--   1 root   root   681090961 Feb 28 12:29 10202_database_solx  
  9. 86.zip  
  10. ……….(省略若干)  
  11. -rw-r--r--   1 root   root   3069440 Apr 29 11:31 tar-1.16-sol10-x86-lo  
  12. cal  
  13. -rw-r--r--   1 root   root   10895360 Oct 22 2006 tar-1.16.tar  
  14. -rw-r--r--   1 root   root     155985 Jul 3 2006 vsftpd-2.0.5.tar.gz  
  15. -bash-3.00# 

***文件的信息,它的文件名是10202_database_solx86.zip,再用命令du –h 10202_database_solx86.zip可直接显示它的大小为650M。
 

  1. -bash-3.00#   du -h 10202_database_solx86.zip  
  2. 650M   10202_database_solx86.zip 

3、移走或删除占用空间的大文件。

大家看一看,找大文件是不是很简单?!当然如果使用awk这样的工具写shell脚本更是方便的法门,还有一个方法是用find加选项 –size,请大家自己去试验。这样,我们对Unix系统的文件系统被塞满的清理策略就讲解到这里了。

【编辑推荐】

  1. 探析Unix操作系统启动
  2. 学习Unix操作系统知识
  3. 列举Unix操作系统实例
  4. Unix操作系统LD_PRELOAD简介
  5. Unix操作系统下的LD_PRELOAD环境变量
责任编辑:小霞
相关推荐

2011-03-23 10:58:52

2010-04-07 18:33:09

Unix操作系统

2013-03-04 09:39:38

HTML5漏洞HTML5漏洞

2010-05-10 19:03:00

Unix文件

2011-03-23 11:13:36

umaskcpiomv

2013-09-17 13:24:07

Unix操作系统

2010-08-19 09:48:41

Unix

2014-10-28 10:53:39

UNIX

2010-05-05 10:13:47

Unix系统

2010-04-30 15:51:48

Unix系统

2010-05-07 17:41:36

BSD Unix

2019-10-11 09:45:19

代码开发密码

2010-05-04 08:52:13

Unix系统

2009-06-18 08:56:52

Unix交换区管理

2010-05-05 16:36:24

Unix系统

2010-04-30 11:22:23

Unix系统

2011-04-14 09:29:41

Unix商标Novell

2010-04-30 14:51:23

Unix系统

2010-04-30 18:02:42

Unix系统

2010-04-30 00:28:07

Unix系统
点赞
收藏

51CTO技术栈公众号