看板 Soft_Job 關於我們 聯絡資訊
我的看法是幾點,條列如下: 1.在未經同意爬網站造成網站服務流量增加的確是不對, 被擋是沒什麼好譴責該網站的,這點沒什麼話說。 2.沒必要電廠商吃到手的肥肉不想吐什麼的, 作過政府案的就知道,以這種不到百萬等級的案子根本不算肥肉。 我是覺得驗收端在刁廠商比較有可能。 3.不過雖然爬網站不對,但是內政部搞了個白痴、不好查、不好用的網站, 而且嘴巴說 open data 但是一直沒有具體進度跟作為, 這點被幹譙只是剛好而已, 所以幹譙內政部的恐龍效率是合理的。 4.我們有繳稅,但繳的這個稅只有含讓你罵政府罵到爽, 並沒有包含讓你免費使用政府所有服務的費用。 像辦很多證件要工本費,換證也是。 電子資料雖然看似便宜,但是架 server 要錢、人工要錢, 要不要免費提供這個服務,還是應該留有討論空間。 5.個人有要求政府開放資料,但政府自己有說要開放資料的, 所以不只是個人、民間、非政府單位的訴求,這點很多人誤會了。 政府自己說會公開的,就不用去討論為什麼要「強迫」政府公開了。 6.是不是五百塊架出來跟這份資料是不是要 open 要 free download , 一點關係也沒有,不要模糊焦點。 7.務實點講解法,這件事情從表面上來看,有兩個簡單的方法解決: 第一個就是繼續幹譙政府取得資料的複雜程度,實在是太複雜, 收費不合理讓政府下不了台想辦法處理, 不過政府在這件事情上,實在是恐龍效率、恐龍反應。 第二個是付費就付費,反正看起來購買資料,根據目前揭露出的新聞, 應該沒有用途及複製次數上的限制,來一個人買了再公開就行了。 這點值得去研究他的授權條款跟確認。 (更新:參考最後一個 Reference ,似乎不得再授權。) 只要沒有使用跟複製次數上的限制, 那就只要找好對應的義工跟對應的資金來源,相信不是什麼難事。 像是我自己就很有興趣贊助資金, 來幾個跑手續的義工相信也不是難事。 顯然第二點比較有可行性,建議大家往這方向走。 --------------------------------- 不過,對不滿意的政策、施政方向進行抱怨,我想應該是很合理的行為, 沒有必要針對這種行為過度敏感就是了。 --------------------------------- 順便相關 Reference 摘一摘,免得大家張飛打岳飛看得資料都不一樣。 @內政部對實價登錄網站的澄清議題 http://goo.gl/ZEHtB @實價登錄網站 10/25 到內政部報告的過程跟回應 http://goo.gl/BNCTM @實價登錄上雲端 服務16日上路 行政院推動政府資料開放OPEN DATA,內政部長李鴻源9日表示, 「政府資料開放勢在必行」。 http://udn.com/NEWS/BREAKINGNEWS/BREAKINGNEWS6/7489371.shtml @內政部週五開放查詢9月份房屋交易實價登錄資料 為此,內政部祭出改善措施,包括以將交易資料轉為圖檔格式, 增加機器人撈取資料門檻,下週一開始開放民眾申請購買登錄資料, 按資料量計價收費,購買100MB以下登錄資料收費2000元, 100MB到500MB資料收4000元,超過500MB收費6000元, 原則上,購買資料沒有用途及複製次數上的限制。 http://www.ithome.com.tw/itadm/article.php?c=77304 @和人民做朋友真的這麼難?民間版全台實價登錄網站的哀歌 其中特別值得 highlight 的是 xDay 轉述 Saturday , 對這事件毫無證據的臆測與陰謀論。 「我猜這是外包廠商做的事情,因為很明顯這個網站是個大失敗, 廠商為了維護自己的利益,把整個資料封閉起來, 內政部也沒在監督,造成這種大開 Open Data 倒車的荒謬事情。」 http://goo.gl/ctCdX @實價登錄案件11月19日起受理批次申請 http://goo.gl/HkI8y 補上這個可能會有資料疑慮的參考資料: 運用本部提供之不動產成交案件實際資訊批次資料(以下簡稱本資料)時 應注意下列事項: (一)本部所提供之資料是受理申請當時之靜態資料, 所有資料仍以本部「不動產交易實價查詢服務網」動態之資料為準。 (二)申請者利用、發行或公開展示利用本資料產生之加值衍生物時, 應以適當方式註明資料來源為本部及資料取得之日期。 (三)申請者未經本部事前書面同意,不得將本資料再授權或交付予第 三人以任何方式加以利用。 (四)申請者加值應用本資料,不得以違背現行法令、有違公序良俗、 有誤導社會大眾、侵害本部利益之虞或其他不當方式為之。 一二四點看起來沒啥問題,這第三點...XD -- 網頁上拉近距離的幫手 實現 GMail豐富應用的功臣 數也數不清的友善使用者體驗 這就是javascript 歡迎同好到 AJAX 板一同討論。 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 42.71.180.29 ※ 編輯: TonyQ 來自: 42.71.180.29 (11/16 23:45)
CRPKT:推 11/16 23:45
TonyQ:不過剛剛發現另一份文件搞不好還是變數 11/16 23:47
Ting1024:推。內政部就是不想被撈資料。 11/16 23:49
Ting1024:撈資料的團體太高調了。把內政部當白癡。 11/16 23:49
※ 編輯: TonyQ 來自: 42.71.180.29 (11/16 23:50) ※ 編輯: TonyQ 來自: 42.71.180.29 (11/16 23:52)
taikobo:推,感謝細心的報導整理 11/16 23:55
codemonkey:有人記得之前的公車APP嗎 11/17 00:04
AreTheyYou:推 但希望政府有善點 11/17 00:08
※ 編輯: TonyQ 來自: 42.71.180.29 (11/17 00:15)
KanoLoa:推整理 11/17 00:24
pennymarkfox:版主英明! 11/17 01:04
knives:推,不過這要是放到其他理盲的,會被噓爆吧不看ID的話,光 11/17 03:07
knives:第一點,那些人會覺得爬網站是合法的行為 11/17 03:08
abcdefghi:找個善心人士, 買一份後, 弄個簡易的查詢網站, 讓大家抓 11/17 06:21
abcdefghi:資料就解決囉, 不過, 東西都電子化了, 為什麼還要這麼高 11/17 06:22
abcdefghi:的工本費? 又不像以前紙本的時代,全人工, 又要影印費 11/17 06:23
iincho:為什麼資料不能收錢? 我還覺得應該搞差別收費咧.... 11/17 06:31
superpai:我看支持用增加流量的方式擋爬網站的人才理盲勒 11/17 08:02
abcdefghi:政府資料可以收費, 但只能收工本費, 整個政府的支出本來 11/17 11:49
abcdefghi:就是全體民眾稅收在養, 還想靠資料賺點零用錢, 不如民營 11/17 11:50
littleshan:爬網站本來就合法 不然你哪來的搜尋引擎 11/17 12:15
littleshan:資料收費是為了彌補散布成本,而不是它的建立成本 11/17 12:18
TonyQ:搜尋引擎一直都是踩邊緣地帶喔... 11/17 12:47
TonyQ:http://goo.gl/dzsSZ 11/17 12:49
TonyQ:相關的訴訟至少有上百件跟相關和解的紀錄。 11/17 12:49
TonyQ:至於資料收費是為了彌補什麼成本,這個是收錢的人說了算,不 11/17 12:50
TonyQ:是外人可以臆測的吧。:P 11/17 12:50
TonyQ:說爬網站就合法的人,大概也搞不清楚這世界上有 License 這 11/17 12:50
TonyQ:東西。 11/17 12:50
littleshan:爬私有資料當然涉及license,但房價資料並不是拿來賣的 11/17 14:16
littleshan:而是政府公開宣稱要開放給全體民眾的資訊 11/17 14:17
littleshan:除非說開放爬資料會影響到其他人正常使用 才有理由去擋 11/17 14:22
littleshan:政府不是私人企業,它是人民養來服務人民的 11/17 14:30
littleshan:收費方式當然要接受公評,豈是他說了算 11/17 14:30
abcdefghi:"影響其他人使用" 這句話有個前題, 是爬網軟體沒寫好, 11/17 14:48
abcdefghi:變成攻擊的行為, 如果只是單純爬網就影響到一般民眾, 這 11/17 14:49
abcdefghi:百分之百是網站的本身太爛, 什麼當初沒預期, 什麼預算, 11/17 14:51
abcdefghi:什麼廠商的問題, 長期墮落的公務員心態, 真的很要不得. 11/17 14:52
TonyQ:@littlesshan 就算是 open data,也有 open data license 11/17 15:38
TonyQ:你沒弄懂這個議題...幹譙政府沒 open data 跟幹譙網站不給爬 11/17 15:38
TonyQ:是完全不同的兩件事。 11/17 15:38
TonyQ:同樣的,今天的問題並不在「蒐集資料有沒有造成網站掛掉」, 11/17 15:38
TonyQ:而是這份資料能不能這樣蒐集。 11/17 15:39
TonyQ:未經同意的 crawler 算是宵小行為,人家沒意見就沒意見, 11/17 15:40
TonyQ:像是大家通常都默許 search engine 來爬,因為對雙方有益, 11/17 15:40
TonyQ:但是真的要鬧上法院,就算是 google 都得乖乖付錢和解買 11/17 15:40
TonyQ:content 。 11/17 15:40
TonyQ:但是當然政府說公開但是弄個爛介面鳥介面,這點是該幹譙的。 11/17 15:45
TonyQ:我也是支持讓政府公開提供資料庫讓開發者自己下載的。:P 11/17 15:46
MonyemLi:爬網跟一般使用者其實是不一樣的行為,連線數差太多 11/17 19:48
MonyemLi:這案子如果全案9x萬,表示用舊主機.滿滿的爬蟲挺有感的 11/17 19:54
iincho:我比較意外的是有人覺得爬網是理所當然...:x 11/17 20:17
lance70176:支持版主看法推 11/17 21:31
littleshan:@TonyQ 如果你認為不論如何未經同意爬資料就是宵小行為 11/17 21:44
littleshan:那我們也不會有共識 我認為許多時候沒明講就是可以爬 11/17 21:45
littleshan:否則我們賴以維生的搜尋不可能這麼好用 僅此而已 11/17 21:45
iincho:樓上你根本搞錯問題,人家不介意可以爬,人家要擋你也沒啥 11/17 22:01
iincho:重點是對方同不同意,高調到不給爬就開罵這倒是第一次見到 11/17 22:01
popmentos:請問如果自己買了一份,然後拷貝成光碟給朋友,或者放到 11/18 00:21
popmentos:網路硬碟,讓大家共用,這樣會觸犯第三條嗎? 11/18 00:21
popmentos:會這問是想,如果寫成桌面板的程式,需不需要每一台電腦 11/18 00:23
popmentos:都要獨立向內政部購買資料? 才能使用桌面板的查詢程式? 11/18 00:25
lance70176:應該有規避法條的方法吧? 比如說把raw data稍做整理 11/18 01:25
lance70176:然後放出整理版 就不算散佈原始資料了吧 11/18 01:26
iincho:........ㄟ..你整理過沒差太多的話還是可以告..XD 11/18 09:18
wolfpig:good job 11/19 16:41