→ oToToT: 我自己的意思是開不起來當然就沒辦法清 09/16 11:26
是,這句沒有疑問,開不起來當然就不可能清。
→ oToToT: 開得起來的話那一樣可以清,除非有人有因為這兩台目前沒開 09/16 11:27
→ oToToT: 而記不起來自己是不是需要保留上面的檔案 09/16 11:27
但是這句的講法就很奇怪了。按照以往慣例,清 tmp2 前都會公告並且留時間給使用者
備份。使用者無法存取、無法備份的機器,除非硬碟故障,否則資料不應該消失,不會
有「開得起來一樣可以清」的狀況。也就是說,發公告當下如果有機器無法連上,那應
該在公告內文中明確將這些機器排除在清理計畫之外,否則對於曾經使用過目前故障中
工作站的使用者,無法備份資料大概等同沒公告直接砍資料。
當然你可能可以說使用者可以要求保留資料,但據我所知清 tmp2 的目的是要求使用者
每隔一段時間必須檢視自己放在工作站的資料,同時也讓使用者知道這不是永久存放資
料的空間,藉此達到減量的目的。因此公告內容可以看出,應該是以備份為主,真的有
困難時才填表單。
但現在的狀況是有些機器上的資料完全無法備份,照理說不應該清理,如果真的要清理,
不就變成是鼓勵大家盡量填表單,無論有無重要資料都來填,理由就說工作站斷線不能
備份?如果每個人都這樣填,我相信多少是會造成工作站管理人員困擾的,也無法達成
原先每學期或每學年資料減量的目的。
→ oToToT: 所以我的想法上在linux10及linux11是與其他台沒有太大的差 09/16 11:29
→ oToToT: 別的 09/16 11:29
→ oToToT: 也就沒有特別在信中描述這些細節 09/16 11:29
我的想法是公告當下連不上就不能清,公告信應該樣要像去年 #1VCN4Uqr 那樣,清楚
說明連不上的機器會如何處理,以免造成使用者各自解讀、產生誤會。
當然我也知道現實狀況是管理者最大,管理者有絕對的權力做任何事,沒有義務要把公
告寫得非常清楚或是揭露相關資訊。但如果可以減少疑點,盡量讓大家充分理解公告內
容,那應該有助於提升管理者和使用者之間的信任關係吧。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.30.246 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/CSIE_WSLAB/M.1631893708.A.B88.html
→ oToToT: 先說我的這些言論都是我自己的,沒有跟其他團隊成員討論過 09/18 01:46
我知道在這裡討論的都只是個人言論。我也只是嘗試用去年的做法類推今年可能的做法,
發覺這次的公告信不太尋常、猜不透這次的清理計畫長什麼樣。
→ oToToT: 我的想法上無法連線上就是一種不可抗力之因素 09/18 01:48
→ oToToT: 所以使用者有想保留東西的話可以直接套第三點申請 09/18 01:48
可是連不上這個不可抗力因素和其他狀況有很明顯的差別。普通的不可抗力因素通常只
是個人的專案、研究需求,屬於少數狀況;連不上是系統異常,屬於普遍狀況。如果要
大家為了管理者已知的系統異常狀況填表單,總是有些怪異的。
→ oToToT: 而且我的理解上是幾乎所有使用者都不會放重要東西在tmp2上 09/18 01:49
我的理解是,目前的制度既然是清理前通知,提醒使用者要備份檔案,動機應該是尊重
使用者在 tmp2 存放資料的權利,不預設資料是否重要。否則如果可以這樣以部分代全
體,那就把規定改成 tmp2 可隨時無預警清空就好了呀。
→ oToToT: 所以某種層度上我會預期大家就算這樣也不會特別想填表單 09/18 01:50
→ oToToT: 也不會造成什麼管理者的負擔 09/18 01:50
如果我今天這樣填表單呢?
工作站帳號:
b00000000,但 /tmp2 下各資料夾裡都可能還有我的檔案,請保留所有包含我的檔案的
最上層資料夾。例如 /tmp2/b00000023/project/report.txt 的擁有者是 b00000000,
那請保留整個 /tmp2/b00000023,底下的檔案無論擁有者是誰都全數保留。
檔案位置:
[*] linux10
[*] linux11
檔案用途:
上學期期末報告和比賽相關檔案尚未備份。
其他備註:
由於這兩臺工作站我連不上,無法確認要保留的資料夾有哪些,上學期又因為分組報告
和比賽而在 tmp2 下許多非自己學號的資料夾存放檔案,已經忘記放了多少地方。因此
必須請管理者在清理之前找出所有我有放檔案的地方,只要有出現就整個資料夾不論擁
有者全數保留,以確保上課資料完整。
→ oToToT: 應該說我覺得最重要的點應該是跟現在大部分使用者的習慣有 09/18 01:52
→ oToToT: 關,所以我才會用此角度去處理這件事情 09/18 01:52
→ oToToT: 這樣才更能減輕使用者以及管理者的負擔 09/18 01:53
我覺得最重要的點是這次的公告沒有講清楚連不上的機器會如何處理,造成看信的人需
要再次詢問(且不一定能得到回應)才能得知確切處理方式。如果能像去年一樣,直接
在信中說明此次異常狀況的將如何處理,我相信能減少使用者可能的疑問。在有去年範
本可抄的狀況下,多寫一句話應該不至於造成管理負擔。
把狀況說清楚,總是比只講大綱,要使用者自行推測細節來得好吧。
還有就是類似連不上事件連續兩年都發生,但處理方式卻完全不同,信中也沒有提醒使
用者今年的計劃不同於去年。才隔一年就把做法整個換掉,是否會讓人覺得政策不連貫,
每年都在做臨時決定呢?這也是我在文章最後說的信任關係。維持一致的做法,使用者
較容易預測,也比較容易讓雙方能互相理解,保持良好關係。
一直以來我都覺得,系上服務和計中服務最大的不同,在於管理者本身也是服務的主要
使用者,比較能夠互相理解、照顧到使用者的需求。雙方因此較能能維持良好關係,而
不會只是抱怨服務有問題、不好用。
※ 編輯: lantw44 (140.112.30.246 臺灣), 09/18/2021 13:20:36
→ oToToT: 就實際上目前沒有這種use case ,所以自然沒有這種困擾 09/18 21:21
→ oToToT: 如果有這種use case就會考慮各種狀況 09/18 21:21
其實我不知道你這裡的 use case 是指什麼,不過應該不重要,我就先忽略了。
→ oToToT: 我承認公告發的不是很詳盡,但我不認為有誰有誤會 09/18 21:21
→ oToToT: 你要說我寫得不夠周全我覺得沒問題 09/18 21:22
好吧,這樣說好了,那個看了公告以後誤解內容、或是有錯誤認知的人就是我。
我的推導過程是這樣的:
一、發文當下有幾臺工作站連不上,而且短時間內不會恢復。
二、使用者連不上工作站就不能備份資料。
三、管理團隊不會在確認狀況前騙使用者硬碟都壞了。
四、管理團隊尊重使用者存放資料的權利,不能備份就不能人為刪除資料。
五、公告信沒有提及何時要清理目前連不上的工作站。
六、公告信外可能另有隱情,推測可能是以下幾種狀況:
ㄅ、管理團隊忘記有工作站還沒上線。
ㄆ、管理團隊放棄清理發文當下連不上的工作站。
ㄇ、管理團隊會安排第二次清理計畫,只清理這次沒辦法清的那幾臺。
所以我上一篇文章的推文都是圍繞在「何時會清第二次」、「是否有規劃清第二次」的
問題上,基本上排除了「連不上的也可以清」的可能性,才會說疑點越來越多。
我不知道實際上有多少人會這樣想,也許幾千個工作站帳號持有者中就只有我一個人有
這種想法,這裡就只是提供我個人的思考方式給大家參考。我講的話不論是在 PTT、電
子郵件、內部聊天群組,都沒有任何約束力,沒有人會因為我說了什麼就需要去做什麼。
我無意干涉團隊運作,只是偶爾會有些「如果是我會怎麼做」的言論。如果有人願意看、
願意回應我寫的東西,我就該心存感激了,畢竟在 B03 離開以後群組裡的人我幾乎都
不認識,忽略陌生人的留言也是人之常情。
→ oToToT: 而且目前tmp2就算無預警非人為被清空本來也是本來就寫在 09/18 21:24
→ oToToT: 條款裡的 09/18 21:24
對,硬碟自然損壞導致資料遺失,這真的有可能發生,以前也確實發生過。但是相較於
每年或每學期的人工清理,發生頻率很低,對同一臺機器來說通常幾年才會發生一次。
因此我覺得硬碟壞掉和人為刪除要分開看,不會因為隨時可能壞掉就可以隨時刪除。
→ oToToT: 當然我們不希望這種情況發生,但本來使用者就應該要定期 09/18 21:25
→ oToToT: 備份檔案 09/18 21:25
對,備份重要檔案本來就是使用者的責任,這沒有疑問。這次公告信矛盾的地方在於,
內文叫使用者盡快備份檔案,但連不上的機器根本無法備份。叫使用者做一件不可能的
事,本來就容易造成疑問。
我的意思不是說把「備份」這兩個字從信中刪除。管理者提醒使用者記得備份檔案絕對
是正確的,但這次的公告信我以一個平時和管理者幾乎沒有聯繫的使用者的角度來看,
我無法 100% 理解管理者希望我怎麼做。
→ oToToT: 而且按照那種填法,他如果是寫重要實驗資料難以移動 09/18 21:27
→ oToToT: 跟工作站本身連不連的上對我們造成的負擔是一樣的 09/18 21:28
→ oToToT: 所以這例子本身麻煩的點跟工作站有沒有開也沒有太大關係 09/18 21:28
我覺得兩者還是有差別的。
一、重要實驗資料難以移動,無論工作站是否連得上都會發生。雖然我有點懷疑同一
個人是否會同時間和不同的人參與多個跨學期實驗,但我們就相信使用者。
二、我上面的例子,如果工作站連得上很可能就不會發生,因為那些並不是需要跨學
期使用或是難以移動的資料,實際上並沒有不可抗力因素導致不能刪除。
以一個尊重、理解管理工作,能體會管理團隊辛苦的使用者來說:
ㄅ、工作站連得上的情況:
一、狀況一需要填表單。
二、狀況二不需填表單,使用者會自行備份。
ㄆ、工作站連不上的情況:
一、狀況一需要填表單。
二、狀況二被迫填表單。
我想差別就在於需要填表單的狀況變多了。
同時如果工作站在線上,使用者可以(好心)提供要保留的最上層資料夾名稱,甚至管
理者可以合理要求使用者給出最上層資料夾名稱,否則不受理。在發這篇文的時候,我
有回去看以前發的公告信,管理團隊真的曾經要求使用者必須給出最上層資料夾的名稱,
不能給複雜路徑,也不能叫管理者用各種搜尋條件自行判斷。當工作站不在線上,考量
到使用者無法上線確認資料夾名稱,自然無法用這類的規定簡化作業流程。
順便說一下,我提的那個例子並不是完全虛構的,而是我遇過的類似狀況。我真的曾經
在同一個學期和不同的人分組合作過,並且都使用工作站作為工作區或是檔案交換空間。
當然那時候工作站都連得上,我可以自行備份,也就不曾填過表單。
→ oToToT: 當然我相信你是立意良善希望有詳盡的公告內容,但我只是想 09/18 21:32
→ oToToT: 表示我覺得這樣的公告本身也沒有太大會造成多數使用者困擾 09/18 21:33
→ oToToT: 的部分 09/18 21:33
→ oToToT: 我們未來也的確可以有更好的公告內容 09/18 21:33
我無從得知這樣的公告內容是否會造成使用者困擾,我只是以一個工作站使用者,同時
曾經是半個工作站管理者的身份,在這裡描述我的想法而已。我會說是半個管理者是因
為我不曾當過工作站組(當年叫客戶監控組)的組員,但我當時幾乎參與了系統組內所
有組別的事務討論,各組的事情也多少做過、或被要求做過一些。
我相信、也希望別人相信,我在這裡寫這些東西是立意良善。如果我完全不在乎工作站,
那我大可不必浪費幾個小時的時間在這裡寫回覆。當然有些事情最初可能還是從私人利
益開始,例如當初會參加這個團體是為了自己的需求想要瞭解、改善服務、探索系統,
順便獲得一點特權、產生一點開源貢獻。但我希望整體來說還是帶給大家好處的。
→ oToToT: 突然想到政策轉彎的部分,我們有確定的政策就只有寫在規範 09/18 21:41
→ oToToT: 裡的東西,目前沒有類似判例或類似的情況是需要參考的吧 09/18 21:41
→ oToToT: 我自己作為使用者也從來沒有預期過各項政策每年會一樣 09/18 21:44
→ oToToT: 我在規劃自己使用工作站的方式從來都只有按明寫出來的規範 09/18 21:45
→ oToToT: 而已 09/18 21:45
你說的應該沒錯,這種小事應該不會重要到有先例一定要遵循,單純是因為去年發生過
類似的狀況,且去年的處理方式很符合我的思考方式(如上面段落所寫),才會聯想在
一起,認為今年的處理方式沒意外的話應該相同。
沒有人要求政策必須連貫,我提出這個並不是說有什麼具有強制力的規範要求政策連貫,
而是純粹的社會(指系上服務使用者,尤其是在校生)觀感問題。畢竟每一次的轉彎,
使用者可能都要花費精神去適應。例如這次面對的清理計畫,某些人可能運氣比較差,
剛好選到了停電後開不起來的工作站。這時候就得花費額外時間提問、填表單,說明自
己在哪些地方放了檔案。若以去年拆成兩次清理,則使用者可直接按照正常流程處理。
試想如果系統組突然宣佈從下週開始,工作站上每個帳號只能有 80 個執行緒。或是寒
暑假期間大學部家目錄容量限縮為 1000000 KiB,開學才能恢復 2000000 KiB。又或是
每個人同時間只能使用一臺工作站的 tmp2,使用第二臺隨時可能被砍資料。這類型的
政策轉彎,會造成現有使用者多大的影響?這些事情目前不一定有明文規範,即使有,
大多也是規範使用者、不是規範管理者。以使用者的觀點來看,反正管理者最大,規定
隨時都有可能改,改動小一點比較容易應對。畢竟每個人都有自己的事情要做,無法一
直把精神放在處理這些事情上。
也許我多少受了 FreeBSD 說的 POLA (principle of least astonishment) 影響才會
想這些吧。軟體升級的時候,希望手動改動少一點。管理規範「升級」時,也希望受影
響的範圍小一點。從 2020 砍助教帳號事件開始,系統服務陸續出現多次重大變更。我
相信大多數的服務變更也不是現任團隊願意的,而是有某些外在壓力。只能說希望接下
來這幾個月沒有服務使用規範大地震吧。這不是請求,只是在許願。
※ 編輯: lantw44 (140.112.30.246 臺灣), 09/20/2021 04:54:35
推 aarzbrv: 工作站上每個帳號只能有 80 個執行緒<-cjlin會哀號吧?XD 09/21 10:27
80 個執行緒在這裡只是虛構的狀況,以現在的環境來說很難再把限制壓得這麼低了。
那段我想說的是,即使使用者把工作站使用規範記得非常清楚,每條規則都能背出來,
還是有可能受到這類不涉及使用規範變更的政策改變影響。因此我認為多數使用者能夠
正常使用服務,實際上或多或少都依賴管理團隊的政策延續。我的觀點是,政策連貫對
使用者來說還蠻重要的,即使只是變更這種連明文規範都沒有的「現狀」,都有可能對
使用者現行使用工作站的方式造成重大影響。
我的意思不是說不能改規定,而是希望只在真的有需要的時候改,可以的話不要改得太
快,使用者可能會跟不上。當然這次的做法改變不算是重大變更,沒有改得太快的問題,
只是我無法理解這次改變的必要性,也感覺不出來改了以後有比較好。再加上公告信沒
講清楚,讓我覺得有點意外、受到驚嚇,因為這項改變可能造成使用者資料遺失。
話說我大一的時候工作站真的是限制 80 個執行緒,那時候我常常踩到這個限制。後來
我在內部會議提議放寬限制,經由多次討論、修改後,放寬為 Linux 工作站 512 個執
行緒、FreeBSD 工作站 256 個行程,延續至今。如果現在還規定只能用 80 個執行緒,
可能連個桌面環境或瀏覽器都開不起來吧。
※ 編輯: lantw44 (140.112.30.246 臺灣), 09/21/2021 14:41:00
推 aarzbrv: 看到您談論未經知情同意的情況,在下發現最近有些工作站 09/22 08:40
→ aarzbrv: 好像會經常讓來自洋蔥路由器出口節點的網路位址連不上 09/22 08:41
→ aarzbrv: ,在下甚至懷疑母系會不會不喜歡電子前哨基金會呀?:~ 09/22 08:42
現在狀況如何我不知道,以我那時候來說的話,這類疑似防火牆主動阻擋的問題幾乎都
來自計中,系上不太會去擋這種東西。如果可以確定是計中的問題,那再來就是寫信問
計中網管看他們是否知情了,有可能是主動擋的,也有可能是防火牆的 bug,他們無法
判斷的話可能會要你帶著筆電主動到辦公室測試。主動擋的有機會可以溝通,防火牆 bug
如果廠商不修就只能看是否能開例外了。
以前我有聽學弟說過校內 Tor 連線會有問題,但我自己沒試過也不知道狀況,不知道
那時候他有沒有向計中確認問題發生原因。不過我那時候有以系上系統管理團隊的身份
去向計中申請讓工作站不要經過各種已知有 bug 的防火牆,一般來說工作站的問題會
比系上其他設備少一些。
不過在這篇(長)文討論網路問題其實已經離題了啦。
※ 編輯: lantw44 (140.112.30.246 臺灣), 09/22/2021 18:45:57
推 aarzbrv: 沒關係,還是謝謝您! 09/23 00:24
推 aarzbrv: (但在下今年透過洋蔥路由器連計中webmail從沒被擋過) 09/23 00:27