利用TNMHTTP元件抓取網頁時,出現了問題! |
缺席
|
chungho_chang
一般會員 發表:16 回覆:7 積分:4 註冊:2003-09-19 發送簡訊給我 |
問題:
(1)如何解決利用TNMHTTP元件抓取編碼為Unicode(UTF-8)的網頁時,出現了無法抓取其HTML Body Contents的內容?
(2)但是如果是抓取編碼為繁體中文Big5的網頁時,就可以抓取其HTML Body Contents的內容,為何不能抓取編碼為Unicode(UTF-8)的網頁呢? 使用元件:TNMHTTP
編碼為Unicode(UTF-8)的網頁:http://210.69.101.63/emcv2_public/psi/psidaily.aspx
編碼為繁體中文Big5的網頁:http://www.cwb.gov.tw/V4/weather/ob/index-ob.htm 測試結果:
(1)編碼為Unicode(UTF-8)的網頁:TNMHTTP會傳回"<h1>Bad Request(Invalid Header Name)</h1>"
(2)編碼為繁體中文Big5的網頁:TNMHTTP會傳回HTML Body Contents的內容 *請問各位高手!這是什麼原因?有解決的方法嗎?麻煩各位高手指教一下吧!
發表人 -
|
本站聲明 |
1. 本論壇為無營利行為之開放平台,所有文章都是由網友自行張貼,如牽涉到法律糾紛一切與本站無關。 2. 假如網友發表之內容涉及侵權,而損及您的利益,請立即通知版主刪除。 3. 請勿批評中華民國元首及政府或批評各政黨,是藍是綠本站無權干涉,但這裡不是政治性論壇! |