我今天收到同事反應,說公司網站的內容被百度給找出來了
雖然說公司網站被搜尋引擎找到是好事
可是如果是使用者上傳的資料,屬於公司內部使用,也被搜尋引擎找到那就不是一件好事了
於是找了凱大人求救,花了大概三個小時終於搞定
下面把我的作法分享給大家參考
re-Compile Apache with mod_rewrite
我的Apache當初在編譯的時候沒有加入rewrite這個模組,所以就先把mod_rewrite編譯進去
另外我還加上了mod_deflate,因為想說既然重新編譯那就順便把Apache加速的模組也編譯進去好了
建立robots.txt
我公司的網站不想讓所有的搜尋引擎機器人找到,因此內容寫成
User-agent: *
Disallow: /
如果你想要了解更多的資訊可以到 http://www.google.com.tw/support/webmasters/bin/answer.py?answer=40362
建立.htaccess 文件
避免使用者使用不正當的連結進行資料存取的行為
首先要先將httpd.conf 裡面的 AllowOverride None 改成 AllowOverride ALL
接著在要防止被連結的目錄下面建立.htaccess檔案,我是建立在根目錄
內容如下:
RewriteEngine on
RewriteCond %{HTTP_REFERER} !^http://blog.hsnd.net/.*$ [NC]
RewriteCond %{HTTP_REFERER} !^http://blog.hsdnnet$ [NC]
RewriteRule .*\.(*)$ /content/no_hotlink.jpeg [R,NC]
將允許的網站放在blog.hsdn.net的位置,
是兩個設定一組的,如果你有多個允許網站就複製貼上然後修改一下
/content/no_hotlink.jpeg 這個是你要讓那些違法連結顯示的畫面
你可以參考我今天做的 畫面
希望這篇文章對大家有幫助,也感謝凱大人的幫忙