Skip to content

Latest commit

 

History

History
25 lines (21 loc) · 531 Bytes

README.md

File metadata and controls

25 lines (21 loc) · 531 Bytes

shota_crawler

This code is from Sheng-Hsiang Lin

  • index.php

    udn crawler的主頁面

  • <li>
    	<p>login.php</p>
    	<p>輸入帳號和密碼的頁面</p>
    </li>
    
    <li>
    	<p>member/action_login.php</p>
    	<p>驗證會員的檔案</p>
    </li>
    
    <li>
    	<p>目前發現有可能重複抓取單則新聞</p>
    	<p>發現時間2015/8/28,關鍵字"客家",新聞則數49509筆,該Case目前也無法順利匯出Excel</p>
                <p>ini_set("memory_limit", "1024M");也不行</p>
    </li>