PDA

ดูเวอร์ชั่นเต็ม : ท่านใดพอมีวิธีแก้อาการ squid เน่า แบบถาวรมั้งครับ


nookgames
30-06-12, 16:21
อาการคือ ออกเน็ตไม่ได้ ส่วนเกมส์ หรือ เน็ต ที่เข้าก่อน squid เน่าจะเล่นได้ปรกติ พักนี้รู้สึกจะเป็นบ่อยเกิน ทุกครั้งที่มีปัญหาผมจะแก้ไขแบบนี้

1. เข้า putty
2. พิมพ์ rm /var/run/squid.pid
3. จะมีถามยืนยัน ให้ตอบ y
4. restart firewall
5. ทำการ clear ไฟล์ log
5.1 พิมพ์ cd /var/log/squid
5.2 mv /var/log/squid/access.log /var/log/squid/access.log.old
5.3 rm -f /var/log/squid/access.log.*
5.4 mv /var/log/squid/store.log /var/log/squid/store.log.old
5.5 rm -f /var/log/squid/store.log.*
5.6 rm -f /var/log/squid/cache.log.*
6. สั่ง restartstart squid, แล้ว restart firewall
credit: ท่านเทพใดไม่รู้

ซึ่งก็จะกลับมาเป็นปรติ ไม่นานก็เน่าอีก ท่านใดพอมีวิธีแก้แบบถาวรมั้งครับ เผื่อเราไม่อยู่ร้าน ให้คนอื่นเฝ้า squid มาเน่าวันนั้น ซวยเลย !!

meam
30-06-12, 17:08
เอาไฟล์ cache.log มาดูก่อนครับ

nookgames
30-06-12, 17:30
/var/log/squid/cache.log

ไฟล์นี้ไช่ป่าวครับ ก็อปปี้ออกมาแล้ว มันเปิดไม่ได้อ่ะครับ

namachi09
30-06-12, 17:34
ลงsquidทับก็หายนะ

meam
30-06-12, 19:30
/var/log/squid/cache.log

ไฟล์นี้ไช่ป่าวครับ ก็อปปี้ออกมาแล้ว มันเปิดไม่ได้อ่ะครับ
แปลกแฮะ ไฟล์นี้เป็น text file นะครับ ถ้าเปิดไม่ได้ชักสงสัยว่าฮาร์ดดิสก์อาจจะมีปัญหาก็ได ้ครับ อ้อ ไฟล์นี้มีขนาดเท่าไหร่ครับ แล้วก็ลองใช้คำสั่งนี้ดูครับ
cat /var/log/squid/cache.logสำหรับฮาร์ดดิสก์ ลองตรวจ smart ดูก่อนครับ ใช้คำสั่ง
smartctl -a /dev/sdaดูค่า 5 Reallocated_Sector_Ct และค่า 197 Current_Pending_Sector และ Error Log (จะแสดงเฉพาะ 5 ครั้งสุดท้าย)

nookgames
30-06-12, 23:17
ลงsquidทับก็หายนะ

ขอบคุณครับ แต่ผมอยากได้แบบให้มันหายถาวร เผื่อไม่อยู่ร้านหลายวัน จะได้ไม่มีปัญหาครับ:o

nookgames
30-06-12, 23:21
แปลกแฮะ ไฟล์นี้เป็น text file นะครับ ถ้าเปิดไม่ได้ชักสงสัยว่าฮาร์ดดิสก์อาจจะมีปัญหาก็ได ้ครับ อ้อ ไฟล์นี้มีขนาดเท่าไหร่ครับ แล้วก็ลองใช้คำสั่งนี้ดูครับ
cat /var/log/squid/cache.logสำหรับฮาร์ดดิสก์ ลองตรวจ smart ดูก่อนครับ ใช้คำสั่ง
smartctl -a /dev/sdaดูค่า 5 Reallocated_Sector_Ct และค่า 197 Current_Pending_Sector และ Error Log (จะแสดงเฉพาะ 5 ครั้งสุดท้าย)

ไช่ครับเป็น text file ขนาดประมาณ 104,872,427 ครับ


smartctl -a /dev/sda <<< คำสั่งนี้ใช้ไม่ได้ครับ

cat /var/log/squid/cache.log <<< คำสั่งนี้มีไรขึ้นมาไม่รู้เป็นพืดเลยครับ คงจะเป็นไฟล์ log ครับ

euensupa
01-07-12, 11:10
Partition ที่เก็บ cache squid เต็มหรือป่าวครับ ช่วงที่ squid เน่า ลอง df -h ดูพื้นที่ดูครับว่า มี partition ไหน use 100% หรือป่าว

meam
01-07-12, 11:32
cache.log ขนาด 100 MB นี่ผิดปกติมากๆ ครับ ถ้า cat ไม่ได้ ลองใช้คำสั่งนี้ดูครับ ดูแค่ 100 บรรทัดสุดท้าย
tail -100 /var/log/squid/cache.logหรือดู 100 บรรทัดแรก
head -100 /var/log/squid/cache.logยังไงขอดู config ของ squid ด้วยก็ดีครับ (squid.conf) แต่ไม่แน่ใจว่าอยู่ที่ไหน (ขึ้นอยู่กับการติดตั้ง)

nookgames
01-07-12, 12:27
Partition ที่เก็บ cache squid เต็มหรือป่าวครับ ช่วงที่ squid เน่า ลอง df -h ดูพื้นที่ดูครับว่า มี partition ไหน use 100% หรือป่าว

นี่ครับ ลองดูตอนมันไม่เน่า

[root@system squid]# df -h
Filesystem Size Used Avail Use% Mounted on
/dev/sda3 71G 3.2G 64G 5% /
/dev/sda1 76M 11M 62M 15% /boot
tmpfs 982M 0 982M 0% /dev/shm
[root@system squid]#

nookgames
01-07-12, 12:33
cache.log ขนาด 100 mb นี่ผิดปกติมากๆ ครับ ถ้า cat ไม่ได้ ลองใช้คำสั่งนี้ดูครับ ดูแค่ 100 บรรทัดสุดท้าย
tail -100 /var/log/squid/cache.logหรือดู 100 บรรทัดแรก
head -100 /var/log/squid/cache.logยังไงขอดู config ของ squid ด้วยก็ดีครับ (squid.conf) แต่ไม่แน่ใจว่าอยู่ที่ไหน (ขึ้นอยู่กับการติดตั้ง)

2 คำสั่งนี้ใช้ไม่ได้ครับ พิมพ์ไปแล้วไม่มีไรเกิดขึ้นเลย
[root@system ~]# tail -100 /var/log/squid/cache.log
[root@system ~]# tail -100 /var/log/squid/cache.log
[root@system ~]# head -100 /var/log/squid/cache.log
[root@system ~]#



นี่ squid.conf ครับ

# -- Squid 2.7 Tuned by MR.BOM SiamCaFe.net
# -- This file is executed by the Squid on stop/start/restart/status.
# -- ClearOS & Clarkconnect squid modifly configuration by Mazzero 10-30-10
# -- Thank MR.BOM SiamCaFe.net

http_port 3128 transparent
icp_port 0
icp_query_timeout 0
mcast_icp_query_timeout 2000
dead_peer_timeout 10 seconds

# ----- Options For Tuning The Cache
quick_abort_min 0 KB
quick_abort_max 0 KB
quick_abort_pct 98

# ----- Time Out
negative_ttl 3 minutes
positive_dns_ttl 53 seconds
negative_dns_ttl 29 seconds
forward_timeout 4 minutes
connect_timeout 2 minutes
peer_connect_timeout 1 minutes
pconn_timeout 120 seconds
shutdown_lifetime 5 seconds
read_timeout 15 minutes
request_timeout 5 minutes
persistent_request_timeout 2 minute

netdb_low 9500
netdb_high 10000
netdb_ping_period 30 seconds

client_db on
client_lifetime 60 minutes

# ----- Acl Controls
acl manager proto cache_object
acl purge method purge
acl all src 0.0.0.0/0
acl localhost src 127.0.0.1

# ----- Webconfig: acl_start
acl webconfig_lan src 192.168.0.0/16
acl webconfig_to_lan dst 192.168.0.0/16

# ----- Webconfig: acl_end
acl our_networks src 10.0.0.0/8 172.16.0.0/12 192.168.0.0/16
acl all_port port 1-65535
acl connect method connect

# ----- Block Web Pramool
#acl release_1 src 192.168.0.111 192.168.0.203
#acl blockpramool url_regex -i pramool.com bbs.pramool.com
#http_access deny blockpramool !release_1

# ----- Block Web
acl blockwebs url_regex -i googleadservices.com googlesyndication.com
acl blockwebs url_regex -i game-thai.com jumran.in.th puipui.in.th rad.msn.com adbrite.com clicksor.com truehits.in.th truehits.net doubleclick.net heru.3322.org go-on.siamteamhost.com alone.inc.gs cabalthai.co.cc lunazeed.com loveglof.no-ip.info
http_access deny blockwebs

# ----- Block Web banned_money888
acl banned_money888 src 61.164.109.99
acl banned_money888 src 121.199.253.130
http_access deny banned_money888

# ----- Block Web your-review.net
acl block_your_review url_regex -i your-review.net order.1and1.com
http_access deny block_your_review

# ----- Redirect google for bing
#acl redirect url_regex -i google.com google.co.th
#http_access deny redirect
#deny_info http://www.bing.com redirect

# ----- No cache
acl NOCACHE url_regex cgi-bin [^z]\? photos[1-9] \.D$ \.ini$ \.dll$ \.inf$ \.Xt \.xtp Loader\.exe 1st$ update.cfg\? urlinfo\.ini$ updatelist notice_popup ProjectG.exe.zip$ start/ucg UCG\.DAT$ UCGA?\.exe$ version\.cfg$\.daf \.xml$ \.ver version_list\.dat SFrame\.exe version_list\.* \.html \.htm version\.* version.ini patchfile.lst
cache deny NOCACHE

# ----- No cache
#acl NOCACHE url_regex cgi-bin [^z]\? photos[1-9] \.D$ \.ini$ \.dll$ \.inf$ \.Xt \.xtp Loader\.exe 1st$ update.cfg\? urlinfo\.ini$ updatelist notice_popup ProjectG.exe.zip$ start/ucg UCG\.DAT$ UCGA?\.exe$ version\.cfg$\.daf \.xml$ \.ver version_list\.dat SFrame\.exe version_list\.* \.html \.htm version\.* version.ini patchfile.lst configupdate we.exe patcher.id patch.id
#cache deny NOCACHE


# ----- Refresh

refresh_pattern \.php\? 0 20% 1440
refresh_pattern -i \.(swf|png|jpg|jpeg|bmp|tiff|png|gif) 43200 75% 129600 override-expire override-lastmod ignore-reload reload-into-ims
refresh_pattern -i \.(doc|xls|ppt|ods|odt|odp|pdf) 43200 75% 129600 override-expire override-lastmod ignore-reload reload-into-ims
refresh_pattern -i \.(mov|mpg|mpeg|flv|avi|mp3|3gp|sis|wma|3gp|mp4) 43200 75% 129600 override-expire override-lastmod ignore-reload reload-into-ims
refresh_pattern -i \.(zip|rar|ace|bz|bz2|tar|gz|exe|rpm|deb|bin|cab) 43200 75% 129600 override-expire override-lastmod ignore-reload reload-into-ims
refresh_pattern -i (.*html$|.*htm|.*shtml|.*aspx|.*asp|.*php) 180 35% 4320 override-expire override-lastmod ignore-reload reload-into-ims

refresh_pattern ^http://*.google.*/.* 180 100% 4320 override-expire override-lastmod ignore-reload reload-into-ims
refresh_pattern ^http://*.google.co.th/.* 180 100% 4320 override-expire override-lastmod ignore-reload reload-into-ims
refresh_pattern ^http://patch.sf.* 4320 100% 43200 override-lastmod reload-into-ims ignore-reload
refresh_pattern ^http://update.cabal.* 4320 100% 43200 ignore-reload override-lastmod reload-into-ims
refresh_pattern ^http://download.cabal.* 4320 100% 43200 ignore-reload override-lastmod reload-into-ims
refresh_pattern ^http://auto-at.asiasoft.co.th/.* 4320 100% 43200 override-lastmod reload-into-ims ignore-reload
refresh_pattern ^http://cbt.patch.easportsfifaonline2.in.th/.* 4320 100% 43200 override-lastmod reload-into-ims ignore-reload
refresh_pattern ^http://autopatch.sdo.in.th/patch/.* 4320 100% 43200 override-lastmod reload-into-ims ignore-reload
refresh_pattern ^http://*.playpark.*/.* 4320 100% 43200 override-lastmod reload-into-ims ignore-reload
refresh_pattern ^http://*.lineage2.*/.* 4320 100% 43200 override-lastmod reload-into-ims ignore-reload
refresh_pattern ^http://*.ini3.*/.* 4320 100% 43200 override-lastmod reload-into-ims ignore-reload
refresh_pattern ^http://patch.dragonica.in.th/.* 4320 100% 43200 override-lastmod reload-into-ims ignore-reload
refresh_pattern ^http://www.titanonline.in.th/.* 4320 100% 43200 override-lastmod reload-into-ims ignore-reload
refresh_pattern ^http://patchaday.winner.co.th/.* 4320 100% 43200 override-lastmod reload-into-ims ignore-reload
refresh_pattern ^http://cdn.worldneedforspeed.com/.* 4320 100% 43200 override-lastmod reload-into-ims ignore-reload
refresh_pattern ^http://*.talesrunner.*/.* 720 90% 4320 reload-into-ims override-lastmod
refresh_pattern ^http://.*\.*$ 0 20% 1440
refresh_pattern ^ftp://.*\.*$ 0 20% 1440
refresh_pattern ^ftp: 0 20% 1440
refresh_pattern . 0 20% 1440



half_closed_clients off
http_access allow manager all
http_access allow manager
http_access allow all_port
http_access allow connect all_port
http_access allow localhost
http_access allow our_networks
http_access allow purge localhost
http_access deny purge
http_access allow webconfig_lan
http_access deny all
http_reply_access allow all
icp_access allow all
cache allow all

url_rewrite_program /etc/squid/store_url_rewrite.pl
url_rewrite_children 10
redirector_bypass on

storeurl_access deny all
storeurl_rewrite_program /etc/squid/store_url_rewrite

# ----- Option Which Affect The Cache Size
cache_mem 256 MB
cache_swap_low 95
cache_swap_high 98

memory_pools no
memory_pools_limit 256 MB
maximum_object_size 512 MB
maximum_object_size_in_memory 32 KB

ipcache_size 4096
ipcache_low 95
ipcache_high 98

fqdncache_size 4096
cache_effective_user squid
cache_effective_group squid
cache_replacement_policy heap LFUDA
memory_replacement_policy heap LFUDA

# ----- Logfile
cache_dir aufs /var/spool/squid 10240 16 256
error_directory /etc/squid/errors/

cache_log /var/log/squid/cache.log
#cache_access_log /var/log/squid/access.log

logformat common %{%Y-%m-%d %H:%M:%S}tl %6tr %>a %Ss/%03Hs %<st %rm %ru %un %Sh/%<A %mt
cache_access_log /var/log/squid/access.log common

cache_store_log none
logfile_rotate 90
pid_filename /var/run/squid.pid

log_fqdn off
client_netmask 255.255.255.255
ftp_passive on
ftp_sanitycheck on
dns_nameservers 127.0.0.1

# ----- Administrative Parameters
cache_mgr squid7by@siamcafe.net
visible_hostname siamcafe.net

# ----- Miscellaneous
collapsed_forwarding on
log_icp_queries off
query_icmp off
buffered_logs off
reload_into_ims on
nonhierarchical_direct off
prefer_direct on
strip_query_terms off
pipeline_prefetch on
ie_refresh on
forwarded_for on
vary_ignore_expire on
store_dir_select_algorithm round-robin
ignore_unknown_nameservers on
balance_on_multiple_ip on

# ----- Snmp
acl snmpcommunity snmp_community public
snmp_port 3401
snmp_access allow snmpcommunity localhost
snmp_access deny all

# ----- Delay Pools

acl ipbydelay src 192.168.1.100
acl patchgames dstdom_regex patch asiasoft asianet audition cabal fsonline ghostonline ini3\. maplestory playarcade playpark ragnarok tsonline yulgang hipstreet lunaonline pangya ran.in.th raycity sa.in.th sf.gg suddenattack talesrunner winner\.
acl filedelay url_regex -i ftp http .3gp .aac .ac3 .act .aif .aiff .amr .asf .au .avi .b5t .bin .bwt .cab .ccd .cdi .cue .dat .dct .div .divx .dss .exe .flac .fli .flv .gho .gsm .gz .ifo .img .iso .m4a .mp2 .mp3 .mp4 .mov .mpe .mpga .mpg .mpeg .mds .nrg .ogg .pdi .qt .ra .ram .rar .raw .rcd .rec .rm .rmvb .rmj .rpm .sea .shn .sri .swf .tar .tgz .vob .vox .vqf .wav .wmv .wma .zip
delay_pools 1
delay_class 1 2
delay_parameters 1 512000/512000 100000/100000
delay_access 1 allow filedelay !patchgames !ipbydelay
delay_access 1 deny all

meam
01-07-12, 12:56
ดู config คร่าวๆ แล้วก็ยังไม่เห็นอะไรผิดปกติครับ (ว่าแต่ยาวจัง ของผมแค่ 115 บรรทัดเอง)

ส่วน smartctl คงยังไม่ได้ติดตั้ง ยังไงลองติดตั้งดูก่อนครับ
yum install smartmontoolsแล้วค่อยเรียก
smartctl -a /dev/sda

golfberserk
01-07-12, 13:13
ติดตั้ง smartmontools โดยใช้คำสั่ง
[root@system ~]# yum install smartmontools
Loading "protect-packages" plugin
Loading "kmod" plugin
Setting up Install Process
Parsing package install arguments
Package smartmontools - 1:5.38-2.el5.i386 is already installed.
Package smartmontools - 1:5.38-2.el5.i386 is already installed.
Resolving Dependencies
--> Running transaction check
---> Package smartmontools.i386 1:5.38-3.el5 set to be updated
--> Finished Dependency Resolution

Dependencies Resolved

================================================== ===========================
Package Arch Version Repository Size
================================================== ===========================
Updating:
smartmontools i386 1:5.38-3.el5 clearcentos-os 336 k

Transaction Summary
================================================== ===========================
Install 0 Package(s)
Update 1 Package(s)
Remove 0 Package(s)

Total download size: 336 k
Is this ok [y/N]: y
Downloading Packages:
(1/1): smartmontools-5.38-3.el5.i386.rpm | 336 kB 00:02
Running rpm_check_debug
Running Transaction Test
Finished Transaction Test
Transaction Test Succeeded
Running Transaction
Updating : smartmontools ######################### [1/2]
Cleanup : smartmontools ######################### [2/2]

Updated: smartmontools.i386 1:5.38-3.el5
Complete!
[root@system ~]#

หลังจากนั้นใช้คำสั่ง fdisk ดู disk ที่อยู่ในเครื่องเรา
[root@system ~]# fdisk -l

Disk /dev/hda: 80.0 GB, 80026361856 bytes
255 heads, 63 sectors/track, 9729 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes

Device Boot Start End Blocks Id System
/dev/hda1 * 1 10 80293+ 83 Linux
/dev/hda2 11 141 1052257+ 82 Linux swap / Solaris
/dev/hda3 142 9729 77015610 83 Linux
[root@system ~]#

เครื่องผม มี HDD server ClearOS ตัวเดียวคือ /dev/sda ตามนี้ Disk /dev/hda: 80.0 GB, 80026361856 bytes
ให้ใช้คำสั่ง smartctl ตามคุณ meam บอก
[root@system ~]# smartctl --all /dev/hda
smartctl version 5.38 [i686-redhat-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF INFORMATION SECTION ===
Model Family: Western Digital Caviar Second Generation Serial ATA family
Device Model: WDC WD800AAJS-00PSA0
Serial Number: WD-WCAPA0019903
ขอย่อคำตอบมาดูบรรทัดสำคัญ
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 200 200 051 Pre-fail Always - 0
3 Spin_Up_Time 0x0003 159 157 021 Pre-fail Always - 3041
4 Start_Stop_Count 0x0032 094 094 000 Old_age Always - 6309
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x000e 200 200 051 Old_age Always - 0

จะมีบรรทัดที่เป็นสีแดงที่ผม mark ไว้ นั้นคือเหมือนกับเช็คค่า HDD
ดูที่ค่า Thresh (ค่ายอมรับได้) และค่า RAW_VALUE (ค่าปัจจุบัน) หากค่าปัจจุบันมีค่าเกินกว่า Thresh นั้นคือ HDD มีปัญหาครับ
วิธีนี้เช็คสำหรับ SSD ได้เช่นกันครับ

ปล. หากตัวหนังสือเยอะเว่อร์ อ่านแ้ล้วงงๆ ให้ใช้คำัสั่ง
[root@system ~]# smartctl --all /dev/hda | grep Rea
1 Raw_Read_Error_Rate 0x000f 200 200 051 Pre-fail Always - 0
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0

ดูค่าสุดท้าย กับ ค่าที่ ก่อนคำสั่งว่า Pre-fail,Old_age เป็นต้น

nookgames
01-07-12, 16:24
ไม่เห็นมีบรรทัดที่คุณ golfberserk บอกกเลยครับ

[root@system ~]# fdisk -l

Disk /dev/sda: 80.0 GB, 80025280000 bytes
255 heads, 63 sectors/track, 9729 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes

Device Boot Start End Blocks Id System
/dev/sda1 * 1 10 80293+ 83 Linux
/dev/sda2 11 266 2056320 82 Linux swap / Solaris
/dev/sda3 267 9729 76011547+ 83 Linux
[root@system ~]# smartctl -a /dev/sda
smartctl version 5.38 [i686-redhat-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF INFORMATION SECTION ===
Model Family: Seagate Barracuda 7200.10 family
Device Model: ST380815AS
Serial Number: 5QZ2Z20M
Firmware Version: 3.AAD
User Capacity: 80,025,280,000 bytes
Device is: In smartctl database [for details use: -P show]
ATA Version is: 7
ATA Standard is: Exact ATA specification draft version not indicated
Local Time is: Sun Jul 1 16:17:01 2012 ICT
SMART support is: Available - device has SMART capability.
SMART support is: Disabled

SMART Disabled. Use option -s with argument 'on' to enable it.
[root@system ~]# smartctl --all /dev/hda
smartctl version 5.38 [i686-redhat-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF INFORMATION SECTION ===
Device Model: 52X32CD_R/RW
Serial Number: [No Information Found]
Firmware Version: 102G
Device is: Not in smartctl database [for details use: -P showall]
ATA Version is: 1
ATA Standard is: Exact ATA specification draft version not indicated
Local Time is: Sun Jul 1 16:19:11 2012 ICT
SMART is only available in ATA Version 3 Revision 3 or greater.
We will try to proceed in spite of this.
SMART support is: Unavailable - Packet Interface Devices [this device: CD/DVD] don't support ATA SMART
A mandatory SMART command failed: exiting. To continue, add one or more '-T permissive' options.
[root@system ~]#

eric
01-07-12, 16:39
ลอง ล้าง ลงใหม่ ครับ อ่านในห้อง Linuxthai หลายๆคนแก้ปัญหากันแบบนี้ ผมก็ทำ
^^

nookgames
01-07-12, 16:50
ลอง ล้าง ลงใหม่ ครับ อ่านในห้อง Linuxthai หลายๆคนแก้ปัญหากันแบบนี้ ผมก็ทำ
^^

ครับ สงสัยต้องลงใหม่ เปลี่ยนฮาร์ดิสก์ด้วยเลย:(

meam
01-07-12, 17:16
ไม่เห็นมีบรรทัดที่คุณ golfberserk บอกกเลยครับ

=== START OF INFORMATION SECTION ===
Model Family: Seagate Barracuda 7200.10 family
Device Model: ST380815AS
Serial Number: 5QZ2Z20M
Firmware Version: 3.AAD
User Capacity: 80,025,280,000 bytes
Device is: In smartctl database [for details use: -P show]
ATA Version is: 7
ATA Standard is: Exact ATA specification draft version not indicated
Local Time is: Sun Jul 1 16:17:01 2012 ICT
SMART support is: Available - device has SMART capability.
SMART support is: Disabled

SMART Disabled. Use option -s with argument 'on' to enable it.


SMART มันปิดอยู่ครับ ให้เปิดก่อน โดยใช้คำสั่ง

smartctr -s on /dev/sda

noyprasop
01-07-12, 17:36
อาการคล้ายของผม access.log ขนาดใหญ่มากแล้วจะแล้ว squidจะเสีย ที่ access.log ใหญ่เกิดจากเด็กใช้โปรบางโปรครับ
ผมแก้โดยเก็บ access.log แยกเป็นวันๆทำให้ไฟล์ไม่ใหญ่ ลองแก้ตามนี้ดูนะครับผมอ่านมาจาก http://www.linuxthai.org
ใช้มาประมาณ 3-4 เดือนแล้วยังไม่มีอาการเสียครับ จากเมื่อก่อน 3-4 วันก็เสียแล้ว

แก้ใน etc/crontab
SHELL=/bin/bash
PATH=/sbin:/bin:/usr/sbin:/usr/bin
MAILTO=root
HOME=/

# run-parts
01 * * * * root run-parts /etc/cron.hourly
30 23 * * * root run-parts /etc/cron.daily
30 23 * * 0 root run-parts /etc/cron.weekly
30 23 1 * * root run-parts /etc/cron.monthly

นาที/ชม./ ตัวอย่างทำงาน 23.30 น ต้องเป็นเวลาที่เราแน่ใจว่า Server เรายังเปิดอยู่ เดิมมันจะตั้งไว้ตอนตี 4


แก้ใน /etc/logrotate.d/squid

/var/log/squid/access.log {
daily ---------------เก็บทุกวัน
rotate 90 --------------90 ไฟล์แล้วลบ
copytruncate
compress
notifempty
missingok


แก้คำผิด : cache.log เป็น access.log

nookgames
01-07-12, 17:46
SMART มันปิดอยู่ครับ ให้เปิดก่อน โดยใช้คำสั่ง

smartctr -s on /dev/sda

login as: root
root@192.168.1.1's password:
Last login: Sun Jul 1 16:12:41 2012 from 192.168.1.100
[root@system ~]# smartctr -s on /dev/sda
-bash: smartctr: command not found
[root@system ~]#


เป็นแบบนี้ครับ สงสัยจะอาการหนัก

golfberserk
01-07-12, 17:47
PM teamviewer มาดูหน่อยครับ login หน้า root ไว้ให้ผมผ่าน putty ด้วย

nookgames
01-07-12, 17:47
อาการคล้ายของผม cache.log ขนาดใหญ่มากแล้วจะแล้ว squidจะเสีย ที่cache.log ใหญ่เกิดจากเด็กใช้โปรบางโปรครับ
ผมแก้โดยเก็บ cache.log แยกเป็นวันๆทำให้ไฟล์ไม่ใหญ่ ลองแก้ตามนี้ดูนะครับผมอ่านมาจาก http://www.linuxthai.org
ใช้มาประมาณ 3-4 เดือนแล้วยังไม่มีอาการเสียครับ จากเมื่อก่อน 3-4 วันก็เสียแล้ว

แก้ใน etc/crontab
SHELL=/bin/bash
PATH=/sbin:/bin:/usr/sbin:/usr/bin
MAILTO=root
HOME=/

# run-parts
01 * * * * root run-parts /etc/cron.hourly
30 23 * * * root run-parts /etc/cron.daily
30 23 * * 0 root run-parts /etc/cron.weekly
30 23 1 * * root run-parts /etc/cron.monthly

นาที/ชม./ ตัวอย่างทำงาน 23.30 น ต้องเป็นเวลาที่เราแน่ใจว่า Server เรายังเปิดอยู่ เดิมมันจะตั้งไว้ตอนตี 4


แก้ใน /etc/logrotate.d/squid

/var/log/squid/access.log {
daily ---------------เก็บทุกวัน
rotate 90 --------------90 ไฟล์แล้วลบ
copytruncate
compress
notifempty
missingok


ขอบคุณครับ จะลองดูครับ สงสัยจะเป็นที่โปรจริงๆครับ โดยเฉพาะโปร pb กับ audition ใช้กันแทบทุกคน

งงนิดหนึ่งครับ สมมติผมตั้งไว้ที่ 12.00น. ถ้าวันน้นตอน 12.00น. ผมยังไม่ได้เปิด server มันจะเป็นไรป่าวครับ

noyprasop
01-07-12, 18:00
ขอบคุณครับ จะลองดูครับ สงสัยจะเป็นที่โปรจริงๆครับ โดยเฉพาะโปร pb กับ audition ใช้กันแทบทุกคน

งงนิดหนึ่งครับ สมมติผมตั้งไว้ที่ 12.00น. ถ้าวันน้นตอน 12.00น. ผมยังไม่ได้เปิด server มันจะเป็นไรป่าวครับ

ไม่เป็นไรครับมันก็จะไปรวมกับวันต่อไปที่เปิดก่อน 12.00 น ครับ

nookgames
01-07-12, 18:22
ไม่เป็นไรครับมันก็จะไปรวมกับวันต่อไปที่เปิดก่อน 12.00 น ครับ

ขอบคุณครับ ลองแล้วครับ ดูว่า จะเป็นไงมั้ง ปรกติอาทิตย์หนึ่งเสีย 1-2 รอบ ครับ

meam
01-07-12, 18:43
เป็นแบบนี้ครับ สงสัยจะอาการหนัก
[root@system ~]# smartctr -s on /dev/sda
-bash: smartctr: command not found
[root@system ~]#


อาการหนักจริงๆ ครับ แต่เป็นผมที่อาการหนัก บอกคำสั่งผิดไปนิดนึงต้องขออภัยครับ ที่ถูกต้องคือ
smartctl -s on /dev/sda
smartctl -a /dev/sda

nookgames
01-07-12, 19:44
นี่ครับ

[root@system squid]# smartctl -s on /dev/sda
smartctl version 5.38 [i686-redhat-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF ENABLE/DISABLE COMMANDS SECTION ===
SMART Enabled.

[root@system squid]# smartctl -a /dev/sda
smartctl version 5.38 [i686-redhat-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF INFORMATION SECTION ===
Model Family: Seagate Barracuda 7200.10 family
Device Model: ST380815AS
Serial Number: 5QZ2Z20M
Firmware Version: 3.AAD
User Capacity: 80,025,280,000 bytes
Device is: In smartctl database [for details use: -P show]
ATA Version is: 7
ATA Standard is: Exact ATA specification draft version not indicated
Local Time is: Sun Jul 1 19:40:13 2012 ICT
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
See vendor-specific Attribute list for marginal Attributes.

General SMART Values:
Offline data collection status: (0x82) Offline data collection activity
was completed without error.
Auto Offline Data Collection: Enabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 430) seconds.
Offline data collection
capabilities: (0x5b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
No Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 1) minutes.
Extended self-test routine
recommended polling time: ( 27) minutes.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 118 097 006 Pre-fail Always - 174476206
3 Spin_Up_Time 0x0003 097 097 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 097 097 020 Old_age Always - 3563
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 087 060 030 Pre-fail Always - 472966655
9 Power_On_Hours 0x0032 084 084 000 Old_age Always - 14784
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 097 097 020 Old_age Always - 3574
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 054 039 045 Old_age Always In_the_past 46 (Lifetime Min/Max 36/46)
194 Temperature_Celsius 0x0022 046 061 000 Old_age Always - 46 (0 17 0 0)
195 Hardware_ECC_Recovered 0x001a 087 063 000 Old_age Always - 97300044
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 178 000 Old_age Always - 694
200 Multi_Zone_Error_Rate 0x0000 100 253 000 Old_age Offline - 0
202 TA_Increase_Count 0x0032 100 253 000 Old_age Always - 0

SMART Error Log Version: 1
ATA Error Count: 18 (device log contains only the most recent five errors)
CR = Command Register [HEX]
FR = Features Register [HEX]
SC = Sector Count Register [HEX]
SN = Sector Number Register [HEX]
CL = Cylinder Low Register [HEX]
CH = Cylinder High Register [HEX]
DH = Device/Head Register [HEX]
DC = Device Command Register [HEX]
ER = Error register [HEX]
ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 18 occurred at disk power-on lifetime: 14263 hours (594 days + 7 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
10 51 01 6e f0 50 e9

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
37 ff 01 6e f0 50 e9 00 00:10:27.136 SET MAX ADDRESS EXT
27 ff 00 6e f0 50 e0 00 00:10:27.011 READ NATIVE MAX ADDRESS EXT
37 ff 00 6e f0 50 e9 00 00:10:26.943 SET MAX ADDRESS EXT
27 ff 01 6e f0 50 e0 00 00:10:25.224 READ NATIVE MAX ADDRESS EXT
37 ff 01 6e f0 50 e9 00 00:10:25.191 SET MAX ADDRESS EXT

Error 17 occurred at disk power-on lifetime: 14263 hours (594 days + 7 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
10 51 01 6e f0 50 e9

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
37 ff 01 6e f0 50 e9 00 00:10:27.136 SET MAX ADDRESS EXT
27 ff 00 6e f0 50 e0 00 00:10:27.011 READ NATIVE MAX ADDRESS EXT
37 ff 00 6e f0 50 e9 00 00:10:26.943 SET MAX ADDRESS EXT
27 ff 01 af f8 50 e0 00 00:10:25.224 READ NATIVE MAX ADDRESS EXT
29 00 01 af f8 50 e0 00 00:10:25.191 READ MULTIPLE EXT

Error 16 occurred at disk power-on lifetime: 14145 hours (589 days + 9 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
10 51 01 6e f0 50 e9

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
37 ff 01 6e f0 50 e9 00 02:09:53.032 SET MAX ADDRESS EXT
27 ff 00 6e f0 50 e0 00 02:09:57.653 READ NATIVE MAX ADDRESS EXT
37 ff 00 6e f0 50 e9 00 02:09:57.594 SET MAX ADDRESS EXT
27 ff 01 6e f0 50 e0 00 02:09:57.369 READ NATIVE MAX ADDRESS EXT
37 ff 01 6e f0 50 e9 00 02:09:57.296 SET MAX ADDRESS EXT

Error 15 occurred at disk power-on lifetime: 14145 hours (589 days + 9 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
10 51 01 6e f0 50 e9

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
37 ff 01 6e f0 50 e9 00 02:09:53.032 SET MAX ADDRESS EXT
27 ff 00 6e f0 50 e0 00 02:09:53.032 READ NATIVE MAX ADDRESS EXT
37 ff 00 6e f0 50 e9 00 02:09:53.031 SET MAX ADDRESS EXT
27 ff 01 af f8 50 e0 00 02:09:53.031 READ NATIVE MAX ADDRESS EXT
29 00 01 af f8 50 e0 00 02:09:53.031 READ MULTIPLE EXT

Error 14 occurred at disk power-on lifetime: 13267 hours (552 days + 19 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
10 51 01 6e f0 50 e9

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
37 ff 01 6e f0 50 e9 00 00:18:12.839 SET MAX ADDRESS EXT
27 ff 00 6e f0 50 e0 00 00:18:12.767 READ NATIVE MAX ADDRESS EXT
37 ff 00 6e f0 50 e9 00 00:18:11.369 SET MAX ADDRESS EXT
27 ff 01 6e f0 50 e0 00 00:18:11.336 READ NATIVE MAX ADDRESS EXT
37 ff 01 6e f0 50 e9 00 00:18:11.336 SET MAX ADDRESS EXT

SMART Self-test log structure revision number 1

SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

meam
01-07-12, 21:39
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0 <---- ยังไม่มีการใช้เนื้อที่สำรอง
9 Power_On_Hours 0x0032 084 084 000 Old_age Always - 14784 <---- เปิดใช้งานมาแล้ว 14784 ชั่วโมง
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0 <--- ไม่มีเซ็กเตอร์ที่อ่านไม่ได้ และรอตรวจสอบว่า Bad จริงหรือไม่

SMART Error Log Version: 1
ATA Error Count: 18 (device log contains only the most recent five errors) <--- มีข้อผิดพลาด 18 ครั้งแล้ว

Error 18 occurred at disk power-on lifetime: 14263 hours (594 days + 7 hours) <--- ข้อผิดพลาดครั้งที่ 18 เกิดขึ้น ณ ชั่วโมงนี้

ข้อผิดพลาดทั้ง 5 ครั้งสุดท้าย เกี่ยวข้องกับ MAX ADDRESS EXT ผมไม่รู้หรอกว่ามันคืออะไร แต่ดูๆ ชื่อแล้วไม่น่าเกี่ยวกับ bad sector ซึ่งค่า 5 และค่า 197 ก็บอกไว้แล้วว่ายังไม่มี sector ต้องสงสัย

สรุปว่าฮาร์ดดิสก์ยังอยู่ในสภาพดีพอสมควร ปัญหาก็คงมาจาก cache.log ใหญ่เกินไปตามข้างบนว่าไว้ละครับ

ปล. ปกติผมเปิดเซิร์ฟเวอร์ 24 ชั่วโมง ก็เลยไม่มีปัญหาไม่ได้ rotate log เลยลืมจุดนี้ไปครับ

nookgames
01-07-12, 23:14
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0 <---- ยังไม่มีการใช้เนื้อที่สำรอง
9 Power_On_Hours 0x0032 084 084 000 Old_age Always - 14784 <---- เปิดใช้งานมาแล้ว 14784 ชั่วโมง
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0 <--- ไม่มีเซ็กเตอร์ที่อ่านไม่ได้ และรอตรวจสอบว่า Bad จริงหรือไม่

SMART Error Log Version: 1
ATA Error Count: 18 (device log contains only the most recent five errors) <--- มีข้อผิดพลาด 18 ครั้งแล้ว

Error 18 occurred at disk power-on lifetime: 14263 hours (594 days + 7 hours) <--- ข้อผิดพลาดครั้งที่ 18 เกิดขึ้น ณ ชั่วโมงนี้

ข้อผิดพลาดทั้ง 5 ครั้งสุดท้าย เกี่ยวข้องกับ MAX ADDRESS EXT ผมไม่รู้หรอกว่ามันคืออะไร แต่ดูๆ ชื่อแล้วไม่น่าเกี่ยวกับ bad sector ซึ่งค่า 5 และค่า 197 ก็บอกไว้แล้วว่ายังไม่มี sector ต้องสงสัย

สรุปว่าฮาร์ดดิสก์ยังอยู่ในสภาพดีพอสมควร ปัญหาก็คงมาจาก cache.log ใหญ่เกินไปตามข้างบนว่าไว้ละครับ

ปล. ปกติผมเปิดเซิร์ฟเวอร์ 24 ชั่วโมง ก็เลยไม่มีปัญหาไม่ได้ rotate log เลยลืมจุดนี้ไปครับ

ขอบคุณครับ คุณ meam เดี๋ยวลองตามวิธีของคุณ noyprasop แล้วจะมารายงานอีกทีครับ (วันนี้เน่าไป 2 รอบละ) :(

nookgames
02-07-12, 12:27
PM teamviewer มาดูหน่อยครับ login หน้า root ไว้ให้ผมผ่าน putty ด้วย

ขอบคุณครับคุณ golfberserk ตอนนี้ลองทำตามวิธีของคุณ noyprasop ครับ ถึงตอนนี้ยังไม่มีปัญหาอะไร ถ้ายังไงมีปัญหาอีก คงได้รบกวนคุณ golfberserk แน่ๆครับ :D

http://upic.me/i/89/v3803.jpg (http://upic.me/show/37055517)

/var/log/squid/access.log {
daily
rotate 90
copytruncate
compress
notifempty
missingok

# run-parts
01 * * * * root run-parts /etc/cron.hourly
00 12 * * * root run-parts /etc/cron.daily
00 12 * * 0 root run-parts /etc/cron.weekly
00 12 1 * * root run-parts /etc/cron.monthly

CyberSpace
02-07-12, 20:18
ว่าแล้วต้องเป็นที่โปร ช่วงนี้มีปัญหาเยอะจริงๆ
แก้ได้แล้วก็ดีครับ ไม่งั้นล่มตลอด

มีอีกวิธีป้องกัน ที่แก้ได้ผลคือ จับตัวโปรว่าวิ่งไปไหน แล้วสั่ง bypass มันเลย

nookgames
02-07-12, 23:41
ว่าแล้วต้องเป็นที่โปร ช่วงนี้มีปัญหาเยอะจริงๆ
แก้ได้แล้วก็ดีครับ ไม่งั้นล่มตลอด

มีอีกวิธีป้องกัน ที่แก้ได้ผลคือ จับตัวโปรว่าวิ่งไปไหน แล้วสั่ง bypass มันเลย

ทำไม่ค่อยเป็นเลยครับ ผมกากมากเรื่อง clearos ครับ ถ้าวิธีนี้ไม่สำเร็จ คงได้ปรึกษาวิธีจับมา bypass จากคุณ CyberSpace ครับ

prira
10-07-12, 13:34
ขอบคุณครับคุณ golfberserk ตอนนี้ลองทำตามวิธีของคุณ noyprasop ครับ ถึงตอนนี้ยังไม่มีปัญหาอะไร ถ้ายังไงมีปัญหาอีก คงได้รบกวนคุณ golfberserk แน่ๆครับ :D

http://upic.me/i/89/v3803.jpg (http://upic.me/show/37055517)

ต้องแก้ส่วนไหนอีกไหมครับ ผมลองทำตามแล้วไม่ได้ครับ

nookgames
10-07-12, 13:55
แก้ตามที่ท่าน noyprasop บอกไว้เลยครับ ตอนนี้ server ผมปรกติละครับ


อาการคล้ายของผม access.log ขนาดใหญ่มากแล้วจะแล้ว squidจะเสีย ที่ access.log ใหญ่เกิดจากเด็กใช้โปรบางโปรครับ
ผมแก้โดยเก็บ cache.log แยกเป็นวันๆทำให้ไฟล์ไม่ใหญ่ ลองแก้ตามนี้ดูนะครับผมอ่านมาจาก http://www.linuxthai.org
ใช้มาประมาณ 3-4 เดือนแล้วยังไม่มีอาการเสียครับ จากเมื่อก่อน 3-4 วันก็เสียแล้ว

แก้ใน etc/crontab
SHELL=/bin/bash
PATH=/sbin:/bin:/usr/sbin:/usr/bin
MAILTO=root
HOME=/

# run-parts
01 * * * * root run-parts /etc/cron.hourly
30 23 * * * root run-parts /etc/cron.daily
30 23 * * 0 root run-parts /etc/cron.weekly
30 23 1 * * root run-parts /etc/cron.monthly

นาที/ชม./ ตัวอย่างทำงาน 23.30 น ต้องเป็นเวลาที่เราแน่ใจว่า Server เรายังเปิดอยู่ เดิมมันจะตั้งไว้ตอนตี 4


แก้ใน /etc/logrotate.d/squid

/var/log/squid/access.log {
daily ---------------เก็บทุกวัน
rotate 90 --------------90 ไฟล์แล้วลบ
copytruncate
compress
notifempty
missingok