學習
1.資訊安全
機房管理以及大數據中心的工作是需要一定程度的資安常識與知識的,設備中所使用資安設備也要精挑細選,不能只是一般的防火牆或是防毒軟體。在科技發達的現代,駭客能用各種方法進到電腦中,因此大數據中心使用FortiGate,這種高效能的防火牆,FortiGates透過黑名單及白名單等各種細節設定來抵擋各種有害的流量、連線。要如何使用FortiGate,就必須要先具備網路架構的基礎知識與概念,了解 Port、協定的定義。學習完基礎定義接著就是資安的部分,例如:該阻擋哪些IP、不該上哪國 IP、不開放較危險的協定,還需要跟使用者確認遠端登入該用哪種協定...等。
2.技術操作
直到進入大數據中心實習之前我幾乎沒有碰過Linux,但在中心的實習工作有很多都需要用到Linux進行操作,還有從終端機使用指令去安裝插件、測試系統、以管理員身分執行指令等等,前面談及的FortiGate與偵測流量、資安問題的FortiSIEM也同樣需要一定程度的操作技術,不管是關聯分析、指定報表產生、封鎖IP、分析特定結果等等,都不是一朝一夕能精通的。
藉由蒐集大量資料並學習其中的規則、特徵經過資料的輸入、訓練模型、測試及分析得到一個能幫助我們分類、辨識事物或是預測以達到節省時間以及提供決策依據的工具。在機方的管理與維護的同時,也跟者學長姐學習machine learning以及deep learning的相關知識。
3.性能指標
為了知道模型結果的正確與否,基本的判斷指標就是混淆矩陣,就如同它的名稱讓容易混淆但又不可或缺,再不同的情況下指標的重要性也不同。
TP:實際為True,預測為Positive。預測的結果與實際情況相同。
TN:即實際為True,預測為Negative。預測的結果與實際情況相同。
FP(Type 1 Error):即實際為False,預測為Positive。預測的結果與實際情況不同。
FN(Type 2 Error):即實際為False,預測為Negative。預測的結果與實際情況不同。
以結果來看我們都希望TP跟FP越高越好,但沒有一樣系統是完美地所以就會有FP及FN在不同的情況下嚴重程度也不太一樣。
準確率(Accuracy)=(TP+TN)/(TP+TN+FP+FN):所有預測正確的結果占總觀測的比重。
精準率(Precision)=TP/(TP+FP):所有positive的結果中模型預測對的比例
召回率(Recall)=TP/(TP+FN):在實際情況是positive所有預測中正確的比例
特意度(Specificity): 在實際情況是negative所有預測中正確的比例